在今年的ACM推荐系统会议(RecSys)主题演讲中,某机构国际新兴商店部门应用科学副总裁将探讨推荐算法研究中面临的三个核心问题:定向图中的推荐、目标标签动态变化下的模型训练,以及利用预测不确定性提升模型精度。
第一个挑战涉及定向图(边关系具有方向性的图结构),其在电子商务中表现为"商品U先于商品V被购买"的非对称关系。传统图神经网络(GNN)的单嵌入空间难以有效建模这种非对称性。解决方案采用双嵌入表示:每个节点同时作为推荐源(source)和推荐目标(target)学习独立嵌入向量,并通过自适应邻域采样技术优化低度数节点的信息聚合——为低连接度节点采样更大邻域,高连接度节点采样更小邻域,显著提升模型表现。
当目标标签存在时间延迟变化时(如用户浏览推荐商品数天后才购买),直接使用实时训练数据会导致标签噪声。研究团队提出重要性采样策略:通过计算真实数据分布P(X,Y)与观测分布Q(X,Y)的比值作为权重系数。关键创新在于结合预转化行为信号(如加入购物车、商品点击),动态评估标签未来变更概率,并将其编码至重要性权重中,有效缓解数据稀疏性问题。
传统模型仅输出点估计概率,而新方法同时生成不确定性估计(预测置信区间)。研究发现:相同预测得分下,置信区间越大实际转化率越低。这对二分类器决策边界选择产生重要影响——针对不同不确定性水平设置多阈值策略,相比单一阈值在固定准确率下可获得更高召回率。该方法已投入实际生产系统。
这些技术均来自实际业务场景的验证,体现了从真实问题出发、通过算法创新解决用户痛点的研究路径。目前预测不确定性相关成果正在撰写论文,而双嵌入GNN和重要性采样方法已在推荐系统中产生实际价值。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。