TLDR: 我们将意图解耦的思想与自动化的对比学习相结合,通过学习包含全局信号的解耦意图特征和自适应的图掩码增强模块,来提供有效的自监督信号,以提高推荐算法的性能。
论文:https://arxiv.org/abs/2305.02759 代码:https://github.com/HKUDS/DCCF
推荐系统已经成为互联网的一种基本服务,其通过学习用户历史交互行为中的偏好,向用户推荐个性化的商品。最近,图神经网络在协同过滤中取得了显著的成果,基于GNN的协同过滤模型通过迭代地信息传递将用户-商品二分图结构拓扑信息编码入特征表示,以进行协同信息聚合。通过在潜在特征空间中捕获高阶用户(商品)相似性,图神经网络协同过滤方法获得了最先进的推荐性能。
然而,在现实世界的推荐数据中,用户-物品交互往往非常稀疏。为了解决监督信号不足导致性能下降的问题,最近的工作尝试将对比学习与GNN相结合,从未标记的数据中挖掘自监督信号。图对比学习(GCL)方法通过最大化已建立的对比增强视图之间的一致性,来学习视角无关的稳定的用户(商品)特征表示。这些方法通常通过遵循互信息最大化原理,实现预定义正样本对的拉近,并将负样本对的特征进行推远。目前,基于图对比学习的推荐算法已经取得了优异的性能。
然而,目前的图对比推荐算法仍然具有两点局限:一方面,现有对比算法忽视了对于用户-交互背后高度耦合的多样意图进行解耦,从而导致了耦合的特征表示学习结果,因此妨碍了推荐系统捕捉真实的用户偏好并提供准确的意图感知自我监督信号,并且使得算法缺乏一定的可解释性;另一方面,许多现有的基于图对比学习的推荐算法在训练时仍然难以提供自适应的自监督学习信号,这使对比学习难以适应具有结构多样性的用户-商品交互图。
为了解决这一问题,我们将提出了一种新的对比学习算法,将解耦意图和图对比学习相结合,并且设计了自适应的图掩码结构增强模块来提供有效的自监督信号以优化模型的训练过程。
我们的算法的主要流程框架如图所示。
遵循前人的研究经验,我们在用户和商品侧各设立了离散的意图原型,并且在模型中用意图原型特征表示来表示这些潜在意图。其次,我们通过计算用户(商品)特征表示与意图特征表示的相似度,来获得它们对于不同意图表示的偏好,并且基于该偏好程度对原型特征进行加权求和以获得解耦意图的特征表示。由于一个意图参与了所有的用户(商品)的特征构成,因此监督信号也会通过其优化每一个用户(商品)特征,从而使其获得了全局信号。除此之外,我们还基于传统的线性图卷积网络,为每个用户和商品学习一个包含局部邻域协同信号的特征表示。
基于已学习到两种特征表示(包含全局信息的意图特征表示和包含局部信息的领域特征表示),我们意在对原有的交互图结构进行自适应的增强,使得重要的交互能够具有更高的权重,以获得一个新的关系矩阵。为了达到这一目的,即需要学习一个图结构掩码,与原始的交互矩阵进行相乘,为了获得图结构掩码的值,我们通过余弦相似度计算邻接节点之间的相关性,并且将其值线性变换到[0, 1]区间。获得了增强后的关系矩阵,我们基于其再次对图上的节点特征进行信息聚合以获得增强后的特征表示。
通过上述模型流程,对于每一个节点(用户/商品),都可以获得四种不同的特征表示,我们基于InfoNCE的思想,将不同特征表示当作不同的视角,从而构建了多视角的自监督学习目标,我们将该目标与传统的BPR监督训练目标相结合构成多任务训练目标来对模型参数进行统一的优化。
我们在Gowalla、Amazon、Tmall三个数据集上开展了比较试验。本文所提出的DCCF在三个数据集上都表现出了优势。与现有方法(解耦意图的算法和自监督算法)相比,DCCF进一步提高了效果,证明了算法设计对推荐效果的积极影响。
我们还在Tmall数据集上,基于商品的类别信息(该信息没有参与训练)对一些用户进行了Case Study。我们首先研究了算法模型在捕获用户之间的全局意图感知语义依赖关系方面的潜在能力,我们发现,在图上即使是距离很远的用户,也会因为其购买的商品类别的相似性,从而产生相似的对于意图偏好的模式,通过该模式说明算法有效地挖掘出了用户之间的依赖联系。
其次,我们研究了算法基于意图感知特征的自适应增强模块所获得的关系矩阵能否有效地优化交互矩阵。通过研究关系矩阵的值我们发现(值越高表示该越重要),当用户对某一类商品类别交互较多时,其对应的商品与用户之间交互的关系矩阵值也越高,反之对于仅交互一次的类别下的商品(说明用户可能不喜欢该类别商品),对应的关系矩阵值较低。该现象说明了本文的解耦意图对比增强方式能够有效的帮助算法学习到不同的用户商品交互意图,从而做到自适应的权重学习以实现自适应增强。
本文提出了一种基于意图解耦和对比学习的协同过滤推荐算法,以挖掘驱动用户和商品交互的潜在意图。首先,本文建模了用户和商品的交互模式,并设计了学习包含意图信息的用户商品特征表示,并将其融入到图网络的信息传递聚合中。
其次,本文设计了一种自适应的图结构增强模块,通过解耦意图所获得的意图感知特征表示来进行结构增强。最后,本文通过多视角对比学习获得基于意图的自监督信号来优化模型中的参数。实验结果表明,该算法在公开数据集上具有有效性和鲁棒性。消融实验也验证了本文算法内部算法模块的有效性。