首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >重新思考序列推荐中的预训练语言模型

重新思考序列推荐中的预训练语言模型

作者头像
张小磊
发布2024-04-18 19:49:39
发布2024-04-18 19:49:39
3460
举报

TLDR: 本文对预训练语言模型和基于预训练语言模型的序列推荐模型进行了广泛的模型分析和实验探索,发现采用行为调整的预训练语言模型来进行基于ID的序列推荐模型的物品初始化是最高效且经济的,不会带来任何额外的推理成本。

论文:arxiv.org/pdf/2404.08796.pdf

在预训练语言模型的帮助下,序列推荐取得了重大进展。当前基于预训练语言模型的序列推荐模型直接使用预训练语言模型编码用户历史行为的文本序列来学习用户表示,而很少深入探索预训练语言模型在行为序列建模中的能力和适用性。

基于此,本文首先在预训练语言模型和基于预训练语言模型的序列推荐模型之间进行了广泛的模型分析,发现预训练语言模型在行为序列建模中存在严重的未充分利用(如下图1)和参数冗余(如下表1)的现象。

受此启发,本文探索了预训练语言模型在序列推荐中的不同轻量级应用,旨在最大限度地激发预训练语言模型用于序列推荐的能力,同时满足实际系统的效率和可用性需求。采用行为调整的预训练语言模型来进行传统的基于ID的序列推荐模型的物品初始化是最高效且经济的序列推荐框架,它不会带来任何额外的推理成本。但与原始版本相比,可以实现显著的性能提升。

在五个数据集上的广泛实验表明,与经典的序列推荐和基于预训练语言模型的序列推荐模型相比,所提出的简单而通用的框架带来了显著的改进,而没有增加额外的推理成本。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与推荐算法 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档