导读
本篇「优青论坛」文章回顾了近期点击模型领域中用于改善搜索排名的建模研究工作,并提出了一种新的基于卷积神经网络整合结果内容特征与用户行为特征的点击模型构建方法。「优青」作者为刘奕群。
刘奕群,清华大学计算机系副教授。2016 年 NSFC“优秀青年科学基金”获得者。优青作者详细介绍参见后文。
现代搜索引擎可以记录用户交互行为,并使用这些记录提高搜索质量。用户点击行为数据已被成功用于提高广告投放、搜索结果排序、查询推荐等方面。虽然点击行为日志可以提供用户点击偏好的隐式反馈,但由于存在点击噪声和行为偏差,进行准确的相关性估计仍很困难。
大量已有研究工作表明,用户点击行为受到诸多偏置性因素的影响,例如位置(用户的注意力随着从上而下浏览信息而衰减)、展现形式(不同展现方式的结果对用户的吸引力不同)、 信任(网站的声誉影响用户的判断等)。为了解决这些问题,研究人员提出了若干行为模型(通常称为点击模型)来描述用户实际浏览行为,并获取结果相关性的无偏差估计。
本文回顾了近期点击模型领域中用于改善搜索排名的建模研究工作,并提出了一种新的基于卷积神经网络整合结果内容特征与用户行为特征的点击模型构建方法。与传统的点击模型相比,本文构建的模型不仅将用户行为假设作为输入信号,还使用搜索引擎结果页面的内容和上下文信息。此外,该模型使用传统点击模型中的参数来限制模型隐藏层中的一些输出的意义。实验结果表明,该模型可比现有传统点击模型取得更好的改善效果。
FCS「优青论坛」由主编李未院士,执行主编熊璋教授和周志华教授发起,以综述论文的形式,集中展现「NSFC 优秀青年基金」获得者对所研究领域的分析和见解,介绍最新的研究进展和成果。
文 章 精 要
领取专属 10元无门槛券
私享最新 技术干货