首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于偏置图采样的关联产品推荐优化

基于偏置图采样的关联产品推荐优化

原创
作者头像
用户11764306
发布2025-08-06 23:31:51
发布2025-08-06 23:31:51
860
举报

在电子商务平台中,向用户推荐与查询相关的产品(如为购买手机的顾客推荐手机壳)是常见场景。产品关联关系通常用有向图表示,其中边的方向性至关重要:推荐手机壳给买手机的顾客合理,但反向推荐则不合逻辑。

在去年欧洲机器学习会议(ECML)发表的论文中,已证明通过为每个图节点建立双重嵌入(作为推荐源和推荐目标的向量表示),图神经网络能有效捕捉产品相似图的方向性。今年在ACM网络搜索与数据挖掘会议(WSDM)上,该研究得到进一步扩展——提出根据节点连接度(与其他节点的连接数量)定制嵌入过程的新方法。这种方法既能利用高连接度节点的中心性,又能通过更长的连接链收集稀疏连接节点的信息。

实验在六个公开数据集上进行,比较新模型与三种前沿模型的性能,测试每次查询推荐5/10/20个产品的情况。通过命中率和平均倒数排名衡量,新模型全面优于其他模型,相对次优模型的优势幅度从4%到230%不等。

图神经网络工作机制

图神经网络(GNN)以图作为输入,输出每个节点的嵌入表示,这些嵌入不仅包含节点自身信息,还包含其与其他节点的关系信息。GNN嵌入是迭代进行的:首轮基于节点关联信息(如产品信息)生成初始嵌入,后续轮次结合自身及其连接节点的嵌入进行更新,该过程可重复直至覆盖整个图。

对于具有大量密集连接(高连接度)节点的图,在嵌入过程中对所有邻居节点进行采样可能不切实际。传统GNN实现存在两个局限:固定采样邻域范围(通常1-2跳),以及采用均匀采样策略(所有邻居具有相同采样概率)。

BLADE方法创新

提出的BLADE(偏置局部自适应方向感知)方法解决了这些局限。其核心创新包括:

  1. 根据被嵌入节点的入度(入向边数量),使用幂律分布动态计算邻域范围
  2. 在嵌入过程中,通过综合考虑邻居节点的出入度来加权采样概率

除公开数据集外,在两个大型内部数据集上的测试显示,该方法相对次优模型的改进幅度达40%-214%。该方法使高连接度节点能发挥其信息中心性优势,同时为稀疏连接节点扩展信息收集范围,从而显著提升推荐系统性能。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档