关注我们,一起学习~
title:Localized Graph Collaborative Filtering link:https://arxiv.53yu.com/pdf/2108.04475.pdf from:SDM 2022
1. 导读
本文是针对图神经网络在推荐系统中的应用提出的相关方法LGCF,对于用户-商品交互数据稀疏的情况下,无法得到较好的embedding来计算偏好。LGCF不需要为每个用户和商品学习embedding,旨在将有用的 CF 信息编码到局部图中,并基于该图进行推荐。
2. 定义
用户-商品二分图表示为G=(U, I, E),
表示n个用户,
表示m个商品,
表示用户和商品的历史交互,
。模型的目标是学习一个函数映射f,计算用户u和候选商品i的偏好分数,
3. 方法
LGCF主要包含两个方面:局部结构的提取来构造局部图;从局部图中捕获相关的模式。如图所示为整体框架图。
简而言之:
局部化图构建模块旨在提取覆盖给定用户-商品对的最重要边(即协同过滤信息)的局部图。需要在训练过程和推理过程中为每个用户-商品对提取一个局部图,因此目标是在考虑可扩展性的情况下让每一个用户-商品对包含最具代表性的边。 简单来说就是通过RWR提取包含目标用户-目标商品对的子图。
如图所示为局部图提取的框架图,分为以下步骤:
和
,每条路径包含了节点的子集
,
。
。
中,可以基于原图G构造子图。节点采用V_ui中的,节点之间的边根据原图G中的关系得到,构造的子图表示为
。
这部分
所采用的标记方式需要达到以下三点:
因此,通过双半径节点标注(DRNL)根据节点到用户-商品对的距离为每个节点生成一个标签,并将生成的节点标签作为输入节点GNN 模型的属性。
含义解释:给定节点 x 和 y,如果 x 与目标节点之间的距离小于 y 的距离,则 x 的标签值应该小于 y 的标签值。如果距离相同,则与目标用户或目标项目的最小距离较小的节点应具有较小值的标签。 DRNL 采用满足上述标准的散列函数 fl() 来计算节点标签。每个节点 x 的节点标记函数 fl(x) 总结如下,其中
,
表示节点到目标用户节点和目标商品节点的最小距离,d=d_u+d_i。
对于局部图
,其中A表示邻接矩阵,X为生成的标签属性。本节采用GCN加池化来得到表征,具体如下,其中
表示经过l层GNN后的节点表征,W为可学习参数,
,
表示度矩阵,池化采用求和,即将所有层的表征求和得到最终表征。
分数越高,说明用户越偏好这个商品,通过单层网络得到最终分数,具体如下,其中w是可学习参数,σ为sigmoid函数。
这里采用BPR损失函数,公式如下,正样本为图中存在的交互行为,负样本为未交互的通过负采样得到。
像lightgcn和ngcf都是在全图上得到embedding,然后进行偏好分数计算的;而lgcf从另一个角度,从局部图上计算分数,将两者结合可以进行信息互补。这里采用两种结合方式:LGCF-emb和LGCF-ens。以lightgcn为例,令
,
分别表示lightgcn从全图上学得的商品和用户的表征,
表示LGCF从局部图中学习到的用户-商品对的表征。
将表征进行拼接,公式如下,其中*表示逐元素相乘,将得到的新表征送入得分函数计算得分。
采用集成的方式,公式如下,其中λ表示超参数或者可学习参数。将两个分数相加得到最终分数。
4. 实验结果
在稀疏数据上的实验结果。
常规场景下的实验结果
5. 总结
本文所述的不需要为每个节点学习embedding的意思是,在为用户u计算推荐的商品偏好时,不需要计算整个图,从而可以不用计算所有节点的embedding。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有