TLDR: 本文提出了一种解耦图神经网络DGNN,对社交推荐进行异构的解耦表征学习。通过引入商品间关系,进一步扩展了协同过滤框架所利用的数据信息。为了对异构关系数据进行解耦表征学习,建立了一种针对不同节点、不同边类别的记忆扩展网络,以针对不同类型的节点和边进行不同的表征空间分解。
论文:arxiv.org/abs/2303.07810 代码:github.com/HKUDS/DGNN 实验室:sites.google.com/view/chaoh
推荐系统通过学习用户的个性化兴趣来为用户推荐商品,以提升服务质量,已经成为电商网站、线上评分平台和广告平台等互联网服务等重要部分。为了解决传统协同过滤框架的数据稀疏问题,社交推荐利用用户之间的社交网络信息作为补充,以扩展模型可以利用的信息。
受到图神经网络成功的启发,越来越多的社交推荐方法使用图神经编码器对用户之间的社交关系图进行建模,迭代地进行信息传播,以捕捉用户的高阶社交关系信息。虽然这些方法取得了一定的成功,但仍然存在以下两个显著问题亟待解决:
为了解决上述的问题,我们提出了一种解耦图神经网络DGNN,对社交推荐进行异构的解耦表征学习。通过引入商品间关系,我们进一步扩展了协同过滤框架所利用的数据信息。为了对异构关系数据进行解耦表征学习,我们建立了一种针对不同节点、不同边类别的记忆扩展网络,以针对不同类型的节点和边进行不同的表征空间分解。具体来说,DGNN的每个记忆单元包括了不同的可学习表征映射算子,对应了不同的解耦表征空间。DGNN通过注意力机制自动化地学习每个节点、边关于这些记忆单元的权重。并且,这种基于扩展记忆单元的解耦表征学习方法被嵌入到DGNN的图神经网络架构中,以在异构图高阶信息传播的过程当中进行表征解耦。
为了对用户之间的社交信息、商品之间的关系信息、以及用户和商品的交互记录进行综合利用,DGNN首先将三种数据进行结合,构建为一份协同异构图,其中商品间关联数据根据关系类别进行构建。因此图中包含有用户节点、商品节点、以及商品关系节点,用户与商品之间的边代表历史交互记录,用户之间的边代表社交关系,商品间关系则通过“商品-关系类别-商品”来表现。构建得到的协同异构图如下所示:
针对包含了三种异构关系的协同图数据,DGNN采用了一种解耦异构图网络进行建模,其架构设计如下图所示。这一网络结构可以分为记忆增强的信息传播过程,和包含异构关系的信息聚合过程两个部分。在每次信息传播中,首先对每种异构关系(即社交关系、商品关系、交互关系)单独进行每条边的信息传播,这里采用扩展记忆单元模块进行表征解耦。在之后的信息聚合过程中,不仅对同一种关系下的多条边进行聚合,也对同一节点收到的多种异构关系进行聚合。上述过程完成了图神经网络的单次迭代,后续叠加多次迭代以提取异构网络中的高阶关系。
基于扩展记忆单元的表征解耦网络包括两个部分,一个是可学习的表征映射参数,对应了一个解耦表征空间表征空间;另一个是由MLP组成的attention计算网络,用于学习每个信息传播的源节点和该记忆单元的权重关系。为了更好地保留异构关系数据的特点,这一记忆注意力网络对每种异构类型的边采用不同的独立权重集合。该模块的具体做法如下图所示。
在构建每条异构关系的传播信息之后,DGNN对每个节点进行传播信息的聚合。对用户节点来说,需要聚合用户-用户社交关系带来的传播信息,以及用户-商品交互关系的传播信息;对商品节点来说,则需要聚合商品-商品关系的传播信息,以及用户通过交互行为传播的用户信息。因此,对用户、商品节点来说,需要进行两种类型节点的信息聚合。DGNN采取了先聚合单种关系的所有信息、再综合多种关系的做法。此外,DGNN还进行了商品的关系类别节点的信息聚合,采取类似用户和商品节点的做法。
上述过程为DGNN单次迭代的信息传播和信息聚合过程,通过如下所示的迭代图信息传播过程,DGNN可以在捕捉高阶关系的同时进行表征的解耦,从而进行更加精准的交互模式学习。
在模型推理之前,DGNN将迭代异构解耦信息传播的结果与用户的社交邻居表征进行结合,从而在用户表征中显式地进行社交关系的加强。之后,DGNN利用最终的用户表征和商品表征,使用点积进行预测,采用BPR损失函数进行推荐损失的计算和优化。
实验在Ciao、Epinions、Yelp三个数据集上进行,具体的统计信息如下。
DGNN与baseline方法的对比结果如下所示,其中包括了社交推荐方法以及一些使用商品侧额外信息的KG方法,或通用异构图方法。
在下图的case study中,展示了两个分别由社交关系和共同交互关系组成的子图,以及分别使用用户间社交关系、用户-商品交互关系,进行建模的表征可视化。圆圈代表用户,而颜色的相近程度反映用户之间的相似程度。从实验结果可以看出,DGNN的异构建模能够很好地反映出节点之间的交互关系类别。在进行社交关系建模时,表征的相似性能够准确地反映社交关系维度的相关性;在进行交互关系建模时,得到的表征又很能够反映出观测的交互记录。
本文提出了一种异构图神经网络(Disentangled Graph Nueral Network, DGNN),将基于扩展记忆网络的解耦合方法与异构图神经网络相结合,并用于对社交关系、商品关系、以及用户行为图数据的综合建模。通过这种方式,扩展了协同过滤方法使用的数据类型,从而得到更好的协同过滤效果;并且,通过嵌入的异构表征解耦,对多种数据类型进行更加细致的表征学习,取得更好的表征效果。将上述方法整合到图神经网络架构中,从而对高阶关系进行了提取。在三个数据集上的充分对比实验,验证了这种方法对有效性。