
在2019年深度学习开发者秋季峰会上,百度对外发布飞桨图学习框架PGL v1.0正式版,历经5个月的版本迭代,PGL再度升级,发布v1.1版本,带来了最新的算法突破、全面的工业级图学习框架能力以及工业级的实践案例。下面我们逐一揭秘升级点。
最新算法突破:
结合语义与结构信息的图神经网络模型ERNIESage
在很多工业应用中,往往出现如下图所示的一种特殊的图:Text Graph。顾名思义,图的节点属性由文本构成,而边的构建提供了结构信息。如搜索场景下的Text Graph,节点可由搜索词、网页标题、网页正文来表达,用户反馈和超链信息则可构成边关系。

PGL团队提出ERNIESage模型同时建模文本语义与图结构信息,有效提升Text Graph的应用效果。其中ERNIE是百度推出的基于知识增强的持续学习语义理解框架,在中英文16个任务上超越业内同类最优模型,以历史上首次超越90大关的成绩登顶自然语言处理领域最权威的GLUE评测榜单,并在最近SemEval 2020上斩获5项世界冠军。
ERNIESage是ERNIE与GraphSAGE碰撞的结果,是ERNIE SAmple aggreGatE的简称,它的结构如下图所示,主要思想是通过ERNIE作为聚合函数(Aggregators),建模自身节点和邻居节点的语义与结构关系。

ERNIESage对于文本的建模是构建在邻居聚合的阶段,中心节点文本会与所有邻居节点文本进行拼接;然后通过预训练的ERNIE模型进行消息汇聚,捕捉中心节点以及邻居节点之间的相互关系;最后使用ERNIESage搭配独特的邻居互相看不见的Attention Mask和独立的Position Embedding体系,就可以轻松构建TextGraph中句子之间以及词之间的关系。
单纯的ID特征的GraphSAGE只能建模结构信息,单独的ERNIE语义模型只能建模语义信息。在PGL的框架驱动下,我们可以轻松结合二者,通过ERNIE捕捉语义信息,并且利用GraphSAGE补充结构特征,通过节点的邻居补充更有用的信息。下图为百度内部某个推荐系统的Text Graph实际场景,ERNIESage通过结合文本与图结构信息,可以取得比独立应用ERNIE和GraphSAGE更好的效果。

得益于PGL的灵活易用特性,ERNIESage能在PGL的Message Passing范式下快速实现,下面介绍PGL v1.1版本的其他亮点特性。
全面的工业级图学习框架能力:
引入多领域模型、领衔工业应用、赋能科研创新
下图是PGL v1.1的框架图,黄色与橙色部分为v1.1版本更新内容,其中橙色为自研的模型算法。

工业级实践案例揭秘:
PGL如何掀起图算法热潮
得益于PGL创新性自研算法加持,以及框架的全新升级,PGL支持的百度内外部业务也是遍地开花,全面覆盖搜索、商业广告、信息流、金融风控、贴吧、用户画像、智能地图等相关业务,可支持百亿巨图场景。下面是一些经典工业级案例介绍。
综合来看,图学习框架PGL依托于飞桨再度升级,带来更多的自研算法、更加全面的框架能力。图学习作为通用人工智能算法之一,势必成为这个时代新的基础设施,赋能各行各业,助燃智能经济腾飞。这仅是图学习热潮的开始,希望有志之士加入PGL,一起共建未来。
END
本文分享自 PaddlePaddle 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!