TLDR: 本文对预训练语言模型和基于预训练语言模型的序列推荐模型进行了广泛的模型分析和实验探索,发现采用行为调整的预训练语言模型来进行基于ID的序列推荐模型的物品初始化是最高效且经济的,不会带来任何额外的推理成本。

论文:arxiv.org/pdf/2404.08796.pdf
在预训练语言模型的帮助下,序列推荐取得了重大进展。当前基于预训练语言模型的序列推荐模型直接使用预训练语言模型编码用户历史行为的文本序列来学习用户表示,而很少深入探索预训练语言模型在行为序列建模中的能力和适用性。
基于此,本文首先在预训练语言模型和基于预训练语言模型的序列推荐模型之间进行了广泛的模型分析,发现预训练语言模型在行为序列建模中存在严重的未充分利用(如下图1)和参数冗余(如下表1)的现象。


受此启发,本文探索了预训练语言模型在序列推荐中的不同轻量级应用,旨在最大限度地激发预训练语言模型用于序列推荐的能力,同时满足实际系统的效率和可用性需求。采用行为调整的预训练语言模型来进行传统的基于ID的序列推荐模型的物品初始化是最高效且经济的序列推荐框架,它不会带来任何额外的推理成本。但与原始版本相比,可以实现显著的性能提升。

在五个数据集上的广泛实验表明,与经典的序列推荐和基于预训练语言模型的序列推荐模型相比,所提出的简单而通用的框架带来了显著的改进,而没有增加额外的推理成本。