本文主要针对序列推荐中的数据稀疏问题提出相应的解决方法,针对现有对比学习在缓解该问题上的不足提出MCLSR。现有方法的不足:由于对复杂的协作信息(例如用户-商品关系、用户-用户关系和商品-商品关系)的建模不足,学习信息丰富的用户/商品embedding还远远不够。本文提出了一种新的用于序列推荐的多层次对比学习框架,称为 MCLSR。与之前基于对比学习的 SR 方法不同,MCLSR 通过跨视图对比学习范式从两个不同级别(即兴趣级别和特征级别)的四个特定视图学习用户和商品的表征。具体来说,兴趣级对比机制与顺序转换模式共同学习协作信息,特征级对比机制通过捕获共现信息重新观察用户和商品之间的关系。
\begin{aligned}
{\left[\mathbf{H}^{u, u v} \| \mathbf{H}^{v, u v}\right] } &=\operatorname{GraphEncoder}^{(l)}\left(\left[\mathbf{H}^{u} \| \mathbf{H}^{v}\right], \mathcal{G}^{u v}\right) \\
\mathbf{H}^{u, u u} &=\operatorname{GraphEncoder}^{(l)}\left(\mathbf{H}^{u}, \mathcal{G}^{u u}\right)
\end{aligned}
3.2.2 跨视图对比学习
然后从两个图中获得的用户特征,输入到 MLP 中,并投影到计算对比损失的空间中:
\begin{aligned}
\mathrm{T}^{F, u u} &=\mathbf{W}_{4}^{p} \sigma\left(\mathbf{W}_{3}^{p} \mathbf{H}^{u, u u}+\mathbf{b}_{3}^{p}\right)+\mathbf{b}_{4}^{p}, \\
\mathrm{~T}^{F, u v} &=\mathbf{W}_{4}^{p} \sigma\left(\mathbf{W}_{3}^{p} \mathbf{H}^{u, u v}+\mathbf{b}_{3}^{p}\right)+\mathbf{b}_{4}^{p},
\end{aligned}
\mathcal{L}^{U C}=\sum_{i=1}-\log \frac{\Psi\left(\mathrm{T}_{i}^{F, u v}, \mathrm{~T}_{i}^{F, u u}\right)}{\sum_{j} \Psi\left(\mathrm{T}_{i}^{F, u v}, \mathrm{~T}_{j}^{F, u u}\right)+\sum_{j \neq i} \Psi\left(\mathrm{T}_{i}^{F, u v}, \mathrm{~T}_{j}^{F, u v}\right)}
同理可以得到商品相关的损失函数
L^{IC}
,则特征级别的损失函数为
L^{FL}=L^{UC}+L^{IC}
3.3 训练
在从顺序视图和用户-商品视图计算用户兴趣表征后,计算得到组合的兴趣表征,公式如下,
I_u^{comb}=\alpha I^{s}_u+(1-\alpha) I_u^c
给定一个带有用户兴趣embedding
I_u^{comb}
和目标embedding
h_o^v
的训练样本 (u, o),用户 u 与商品 o 交互的可能性可以通过采样的softmax计算。预测的目标函数是最小化以下负对数似然,
\mathcal{L}^{p}=\sum_{u \in U}-\log \frac{\exp \left(\left(\mathbf{I}_{u}^{c o m b}\right)^{T} \mathbf{h}_{o}^{v}\right)}{\sum_{k \in \operatorname{Sample}(\mathcal{V})} \exp \left(\left(\mathbf{I}_{u}^{\operatorname{com} b}\right)^{T} \mathbf{h}_{k}^{v}\right)}