快手消费策略算法团队注意到了这一问题,他们想让推荐系统不止「会猜」,而是「懂你」。为弥补这一缺失的建模角度,快手消费策略算法团队联合快手基础大模型与应用部及武汉大学,提出了 TagCF 框架,让推荐系统从「知其然」迈向「知其所以然」。
该研究成果已被 NeurIPS 2025 接收,相关代码与实验框架已全面开源,旨在为学术界与工业界提供一套以「理解驱动」为核心的推荐系统方法论。

用户理解:A Missing Formulation

图 2
当推荐系统通过统计模型学出两个内容之间的关联并据此进行推荐时,这种关联背后往往隐藏着用户角色这一「混杂因素」。如图2 所示,headset-symphonist-violin 的关联关系,实则来源于「交响乐手」这一用户角色;在电商场景中,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点。相比基于 ID 的传统隐式建模,引入 user role 视角让推荐系统得以更清晰地理解用户,从而迈向显式的可解释推荐演进。
另一方面,当需要建模 topic-topic 关联时,本身可以将其当作 topic-role-topic 关联的结果图。这意味着引入 user role 的建模方式在逻辑上更具通用性与表达能力。这种通用的协同行为建模,不仅能捕捉那些统计方法难以识别的弱交互,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证)。
并且,团队还通过实验发现,基于 user role 的建模在统计意义上优于传统的 topic 建模,不仅具备更稳定的空间,也能带来更显著的推荐效果提升。
综上所述,一个更有效的推荐系统需要有能力通过用户与物料之间的交互数据,学习到用户是一个什么样的人,并找到涉及用户角色的通用的原则性的客观逻辑规律。
注:文章后续描述中 user tag = user role = 用户特性,item tag = item topic = 兴趣点。
两个新任务
除了传统的推荐任务外,本研究借鉴 topic modeling 的思路,为推荐系统拓展出两个新任务:
用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包含但不限于用户直接提供的特征值(如性别和年龄)。
用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3),可细分为 I2U 和 U2I 两个子任务:

图3
模块设计

图4 - TagCF 主要功能模块
TagCF 主要包含如下三个模块:

图5

图6
注:文章认为内容理解中台产出的 tag-logic 体系虽然来自于推荐系统且验证于推荐系统,但其具有一定通用性,尤其行为逻辑图也被验证有一定迁移能力,未来可以为其他相关业务(如电商和搜索)赋能。
挑战和工程方案
实现过程中也存在如下挑战:无限制生成导致的 tag 集合无序扩张、视频覆盖率长尾分布、无序生成和精细打分需求的矛盾、大模型生成结果缺乏评测手段等。
为了解决上述问题,文章提出了几个有效的解决方案并在线上落地:

经验上,cover sets 在量级上为 7k-20k 不等,相比开放语义空间中的全集,cover sets 能够在 30 天内收敛,在工业场景下具有足够的稳定性和通用性,有利于各种下游链路的研发。


显式茧房建模和突破
基于上述三个模块,TagCF-it 模型延续兴趣点建模思路,而 TagCF-ut 模型则拓展至用户角色识别与行为逻辑挖掘。至此,推荐系统已有能力显式地建模用户茧房并通过统计模型进行对齐。
具体的,团队通过学习得到的模型预估出对应的茧房内(top-20)tag 集合,记为 T(0),然后通过 U2I 和 I2U 逻辑图以一定 branch factor 进行发散,得到茧房外的 tag 集合,记为 T(1)。下图为示例:

可以显式控制的两种预估策略:
离线实验
主实验在快手的 industrial 离线数据集上首先得到验证。

实验结论:
三个增强模块的 Ablation 验证了对应模块设计的有效性。

线上实验
在研究中,团队进行了线上重排阶段的模型增强实验,其具体的 workflow 如下图:


此外,团队还观测到,usertag 集合比 itemtag 集合具有更强的稳定性和表达能力,体现在其更小的集合大小、更快的收敛速度(如下表所示)以及 3.1 节所示更强的模型增强效果。这些优势意味着,相比兴趣点,用户角色是更加稳定的特征,更加适于推荐系统中的建模和分析。

快手团队从推荐系统的「双端视角」出发,首次提出「视频理解与用户理解并重」的理念,并证明了以用户理解为核心的推荐系统在当前范式下的独特优势。推荐系统的目标从来不只是「推荐内容」,它更关乎理解人(微观)与社会(宏观)的科学。
基于这一理念,团队构建了 TagCF ——包含 tag-logic 内容理解中台和推荐系统增强两个组成部分。tag-logic 内容理解中台具备强大的可迁移能力,其通用框架也可以在召回等其他链路阶段使用,未来可扩展至召回、电商、搜索等多业务场景;另一方面,推荐系统增强模块将有能力直观建模用户茧房并进行突破和探索。
推荐系统与大模型的结合,正在让内容分发进入一个全新的阶段。
它能更聪明地理解用户、更精准地匹配内容,也带来了关于隐私、安全与公平的新思考。未来,团队将继续完善 tag-logic 中台体系,探索更高效的推理与资源利用方式。
长期以来,行业主要深耕于统计模型建模路径,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿技术成果。而本文提出的显式用户理解与 tag-logic 建模方法,则在符号与统计两种范式之间搭起了桥梁,为行业带来了全新的想象空间。
更重要的是,tag-logic 逻辑图让系统有能力从用户的信息茧房出发,展开有逻辑的语义探索——既保持精准,又敢于突破。如何在「准确」与「多样」之间找到平衡,正是推荐系统进化的关键命题。从「懂内容」到「懂人」,TagCF 的探索不仅是技术的一次跃迁,更是技术贴近真实的人与社会的具象体现。
参考文献:
[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.
[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu, Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024
[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).
[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).
© THE END
转载请联系本公众号获得授权