首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >有偏图采样优化关联产品推荐技术

有偏图采样优化关联产品推荐技术

原创
作者头像
用户11764306
发布2025-09-02 23:29:55
发布2025-09-02 23:29:55
710
举报

有偏图采样提升关联产品推荐效果

电子商务平台经常需要向用户推荐与查询相关的产品,例如向购买手机的用户推荐手机壳。产品关系通常用有向边图表示,其中边的关系是单向的:向购买手机的用户推荐手机壳合理,但反向推荐则不合适。

在去年欧洲机器学习会议(ECML)上发表的研究表明,图神经网络(GNN)可以通过为每个图节点使用双重嵌入(向量表示)来捕捉产品相似性图的方向性:一个嵌入表示节点作为推荐源,另一个表示作为推荐目标。

在今年ACM网络搜索与数据挖掘会议(WSDM)上,该研究得到进一步扩展,提出了一种新的有向图节点嵌入方法。该方法根据图节点的度(与其他节点的连接数)定制嵌入过程,从而利用高度连接节点的中心性,同时更广泛地收集低度连接节点的信息。

图神经网络与嵌入过程

图神经网络(GNN)是以图作为输入并输出每个图节点嵌入的神经网络,这些嵌入不仅捕获节点本身信息,还包含其与其他节点的关系。嵌入可用于链接预测、异常检测或关联产品推荐等任务。

GNN嵌入是迭代的:首先网络基于节点关联信息(如产品信息)嵌入每个节点;然后基于自身首轮嵌入和连接节点的嵌入重新嵌入每个节点。该过程可无限重复,将嵌入节点的邻域扩展到两跳、三跳乃至整个图的大小。

对于具有许多密集连接(高度)节点的图,将所有邻居纳入节点嵌入可能不切实际。因此GNN通常在嵌入过程的每次迭代中对邻居进行采样。

传统方法的局限与BLADE方案

在典型GNN实现中,每个节点的邻域大小(影响其嵌入的跳数)是固定的,通常为一或两跳。节点采样通常是均匀的:给定节点的每个邻居都有相同的概率影响节点嵌入。

这种方法存在局限。对于高度节点,一跳或两跳嵌入可能足够:直接邻域包含足够信息来表征节点。但对于低度节点,可能需要更长的连接链来收集足够信息以生成有用嵌入。

同样,如果被嵌入节点同时连接到高度和低度节点,采样高度节点通常更有效,因为其嵌入包含更多邻域信息。均匀采样因此错过了丰富节点嵌入的机会。

新方法BLADE(偏置局部自适应方向感知)解决了这两个局限。它基于先前提出的框架,为每个节点生成源和目标嵌入。

自适应邻域大小与偏置采样

BLADE的嵌入范围根据被嵌入节点的入度(入向边的度)而变化。研究通过幂律分布计算邻域大小,该分布考虑了节点的入度和图中所有节点的最小入度。同时通过考虑图中所有节点的入度来估计幂律系数。

该方法还提供了一种机制,通过在嵌入过程中考虑邻居节点的入度和出度,加权采样邻居节点的概率。

实验效果

在实验中,新模型与三种最先进的先前模型在六个不同公共数据集上进行了比较,每个查询有三种推荐数量(5、10和20)。新模型在所有情况下均优于其他模型;以命中率和平均倒数排名衡量,其优于次优模型的幅度从4%到230%不等。

除了在六个公共数据集上测试外,还在两个大型内部数据集上进行了测试。新模型的改进同样显著,与次优模型相比幅度在40%到214%之间。

该方法显著提升了关联产品推荐的准确性和效率,为图神经网络在推荐系统中的应用提供了新的技术路径。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 有偏图采样提升关联产品推荐效果
    • 图神经网络与嵌入过程
    • 传统方法的局限与BLADE方案
    • 自适应邻域大小与偏置采样
    • 实验效果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档