首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >QQ浏览器:小说召回中的DSSM模型优化实践

QQ浏览器:小说召回中的DSSM模型优化实践

作者头像
腾讯大讲堂
发布于 2021-02-01 02:40:11
发布于 2021-02-01 02:40:11
2K1
举报

作者:jessiexyliu  腾讯PCG算法工程师

|导语 随着小说召回业务的需求发展,在注重点击率的同时,还需要关注阅读转化率的效果,故此我们开始了多目标召回模型的探索之旅。

一. 背景介绍

在一般的召回场景中,以点击为正样本来训练模型就基本可以满足需求,但是在小说推荐场景,点击其实只是用户很浅的小说行为,我们更关注的是如何让用户产生真正的阅读。在这样的背景下,我们希望可以搭建一个以阅读为目标的模型,无奈现实是骨感的,用户真实阅读的样本数远远小于推荐系统展现给用户的数量,同时有真实阅读的用户也仅占全量用户的一小部分,即存在数据稀疏问题(data sparsity,DS)。由此,我们考虑将点击和阅读相结合,用点击数据帮助训练阅读指标,多目标召回模型也就应运而生。

二. 多目标召回模型的演进

1. 初版模型:添加辅助loss

当我们要同时考虑点击和阅读效果时,最直观易行的方式就是先保持DSSM双塔结构不变,在原有的点击单目标loss基础上,加入阅读的辅助loss,希望模型在训练用户与点击书籍的向量相似度的同时,提升用户与阅读书籍的相似度。具体loss公式如下:

这样做的优点比较明显,操作简单易行,同时可以有效的防止过拟合。但模型的问题也显而易见,因为两者的embedding是完全共享的,我们的美好预期是一个embedding就可以既表达点击又表达阅读,但是实际由于点击和阅读向量本身会存在一定差异,强行用一个embedding表示,可能会同时折损两方信息,最后事倍功半。从离线效果评估来看,这版的指标也确实没有明显的效果,由此说明,还是要对模型结构做出一定调整,来适配多目标的需求。

离线指标:

2. 基于多塔结构的多目标召回模型:

由前面的离线验证效果可知,双塔结构一定程度会束缚模型对user和item的表达,这时很自然的就想到,需要用多塔来进行user和item的表征,但如何在“互相掣肘”和“互不干预”之间找到平衡,是多目标模型一直在力求解决的问题。我们这里同时尝试了多种模型构造方式。

1)四塔结构:这里是借鉴ESSM的思想,只共享底层embedding look-up table,上层用两个塔分别训练两个label对应的embedding向量。这里是希望在embedding层面完全将两个label的训练分开,只在计算loss的时候做两者的聚合,优点是不会再出现上面提到的“相互掣肘”的情况,缺点是没有解决阅读label样本稀疏问题,会导致对应user embedding的过拟合问题。

2)三塔结构:在上面四塔结构的基础上,将user合并为一个塔训练,item用两个塔分别训练两个label对应的embedding。这里的考虑还是阅读label的样本稀疏问题,所以user tower选择将两个目标合并训练,而相对来讲书籍的稀疏性并不明显,所以可以保留书籍侧的双塔双目标结构。

下面是两个结构的离线指标,可以看出两者在点击和阅读的hit ratio(即召回率指标)都有小幅的提升,但也都不显著。

3.基于MMOE的多目标召回模型

到目前为止,我们其实只是在“互相掣肘”和“互不干预”之间相互摇摆,还远没有达到“相辅相成”的程度。不论是Share Bottom Model的模型结构,还是soft参数共享的相关结构,都或多或少也存在现在的问题。那么该如何让两个目标既能相互作用,又能保留自己的独特信息呢?这时MMOE模型进入了我们的视野。

MMOE结构如下:

由于很多文章都已经介绍过MMOE模型,在此我就不再赘述了,对我们的场景进行MMOE的适配后,离线实验效果如下:

可以看到借鉴mmoe结构的离线效果最好,于是我们选取这版模型上线实验,最后从实验效果来看,这版模型也确实带来了阅读转化率的提升。

三. 后续优化

1. 多目标loss的不同组合方式:目前我们只采用了简单的线性加权,在确定模型结构后对权重值做微调,但其实这里的花样是很多的,比如用时长作为label的加权,或者ESSM一样的乘积方式等等,这里我们后续也会做更多的尝试。

2.模型结构的尝试:我们现有的优化逻辑,都是基于最初的单目标版本层层改进,但其实很多其他类型的模型结构都没有尝试过,比如阿里从MIND到ComiRec的Capsule网络系列等。

多目标召回领域还有很多东西可以实践探索,非常欢迎感兴趣的朋友们一起交流共同进步。

参考文献:

[1] Huang, Po-Sen, et al. "Learning deep structured semantic models for web search using clickthrough data." Proceedings of the 22nd ACM international conference on Information & Knowledge Management. 2013.

[2] Ma, Jiaqi, et al. "Modeling task relationships in multi-task learning with multi-gate mixture-of-experts." Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.

[3] Ma, Xiao, et al. "Entire space multi-task model: An effective approach for estimating post-click conversion rate." The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. 2018.

近期热文

浅谈SWOT分析法

《QQ炫舞》十二年成熟游戏的求变思新之路

基于Scrapy的爬虫解决方案

让我知道你在看

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大讲堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
求教,MMOE是怎么做召回的,user emb和item emb怎么输出?
求教,MMOE是怎么做召回的,user emb和item emb怎么输出?
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
得物社区推荐精排模型演进
得物社区是一大批年轻人获取潮流信息、分享日常生活的潮流生活社区。其中用户浏览的信息,进行个性化的分发,是由推荐系统来决策完成的。目前得物社区多个场景接入了推荐算法,包括首页推荐双列流、沉浸式视频推荐、分类 tab 推荐流、直播推荐流等多个场景,为了给用户提供更好的服务和体验,我们从整个推荐系统维度为相关服务做了大量优化。现在主流的推荐系统都会有召回、粗排、精排和机制等多个模块组成,本文主要介绍我们在精排层面演进过程中做的一些工作和思考。
得物技术
2023/07/04
1.6K0
得物社区推荐精排模型演进
​大厂技术实现 | 腾讯信息流推荐排序中的并联双塔CTR结构 @推荐与计算广告系列
双塔模型是推荐、搜索、广告等多个领域的算法实现中最常用和经典的结构,实际各公司应用时,双塔结构中的每个塔会做结构升级,用CTR预估中的新网络结构替代全连接DNN,本期看到的是腾讯浏览器团队的推荐场景下,巧妙并联CTR模型应用于双塔的方案。
ShowMeAI
2021/11/24
3.7K1
​大厂技术实现 | 腾讯信息流推荐排序中的并联双塔CTR结构 @推荐与计算广告系列
全链路总结!推荐算法召回-粗排-精排
大家好,这里是NewBeeNLP。现在的推荐系统都是一个很大的漏斗,将整个推荐系统分为(recall -> pre-rank -> rank -> rerank)。
NewBeeNLP
2022/11/16
3.9K0
全链路总结!推荐算法召回-粗排-精排
知识蒸馏怎么用?召回-粗排篇
其实,知识蒸馏在召回-粗排-精排这三个模块都有用武之地,今天我们就来讲讲在粗排和召回中的应用。
NewBeeNLP
2022/06/06
1.7K0
知识蒸馏怎么用?召回-粗排篇
百度双塔召回引擎MOBIUS
对于一个搜索或者推荐系统来说,分阶段的设计都是当下的一个标配,主要是为了平衡效率和效果,在百度的广告系统中,也是分成了如下的三层结构:
felixzhao
2023/04/01
8610
百度双塔召回引擎MOBIUS
腾讯 QQ 看点图文多目标推荐实践经验
作者:zhongzhao,腾讯 PCG 应用研究员 在推荐系统中,最常用的排序模型是以用户点击为目标的 CTR 预估模型,它没有考虑用户点击后的消费深度,也没有考虑用户的多种互动行为带来的生态方面的收益。为了取得 CTR 以外的更多收益,QQ 看点团队在深度学习框架下,对推荐系统中的多目标建模做了一系列的研究和实践,在图文场景下完成了技术落地,实现了用户阅读时长的显著提升,并在内容生态和账号生态上也取得了正向收益。本文将由浅入深,分享腾讯 QQ 看点图文多目标推荐实践中积累到的经验和方法,供有需要的同
腾讯技术工程官方号
2021/04/12
2.4K0
大众点评内容搜索算法优化的探索与实践
本文整理自美团技术沙龙第80期《美团内容智能分发的算法实践》,分享内容主要包括三部分。第一部分介绍了大众点评内容搜索的场景特点以及面临的挑战;第二部分介绍了为应对这些困难和挑战,技术团队在链路各环节上做的实践优化,包括内容消费和搜索满意度的优化等等;第三部分是总结和对未来的展望。希望能对大家有所帮助或启发。
美团技术团队
2024/03/22
3590
大众点评内容搜索算法优化的探索与实践
知乎搜索排序模型的演进,答主必看
知乎作为一个大型的中文问答社区,有超过四千万的提问和超过两亿条回答,其中蕴含了丰富的知识、经验和见解,知乎搜索是帮助用户快速获取信息,找到答案的重要途径,随着媒介的升级,搜索结果的形式也不在局限于图文,视频解答也越来越多。
程序员小跃
2021/02/25
2.2K0
知乎搜索排序模型的演进,答主必看
深度学习推荐系统中各类流行的Embedding方法(上)
Embedding,中文直译为“嵌入”,常被翻译为“向量化”或者“向量映射”。在整个深度学习框架中都是十分重要的“基本操作”,不论是NLP(Natural Language Processing,自然语言处理)、搜索排序,还是推荐系统,或是CTR(Click-Through-Rate)模型,Embedding都扮演着重要的角色。
OpenCV学堂
2020/05/26
6.1K0
[SIGIR'21] DMTL:召回场景基于蒸馏的多目标学习方案
推荐系统中,点击率预估是很通用的排序方法。但是,在feeds流中,pCTR只能说明用户点击这个内容的概率,而不能说明用户有多喜欢或者说在点击之后是否有可能阅读或者停留的概率。有些低质量但是标题党的内容,用户就很容易点击。但其实点击完之后,可能并不会阅读。所以,只对点击建模不能保证用户对这些点击过的内容的满意度。在feeds流中,为了提升用户体验,阅读时长也应该被考虑进来。
Houye
2021/12/02
1.4K0
[SIGIR'21] DMTL:召回场景基于蒸馏的多目标学习方案
京东个性化向量召回算法DPSR
对于一个搜索系统来说,通常采用的召回都是基于倒排索引的召回,简单来说就是需要对item侧建立倒排索引,在检索的过程中,对query分词,根据分词结果去倒排索引中查找词匹配的item,简单的流程如下图所示:
felixzhao
2023/04/01
1K0
京东个性化向量召回算法DPSR
极致细节:OPPO搜索广告召回模型落地分享
Que2Search是Facebook的经典论文,之前我们详细解读了Que2Search的技术方案和一些个人的思考,感兴趣的同学可以移步观看:
NewBeeNLP
2023/09/01
1.1K0
极致细节:OPPO搜索广告召回模型落地分享
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下诞生的内容化产品,打造出有用、有趣、潮流、奇妙、新鲜的内容,为消费者提供全新的内容消费体验。在这个场景下的内容召回有很多问题需要探索,其中主要的特点和挑战有:
汀丶人工智能
2023/02/25
2.7K0
美团搜索多业务商品排序探索与实践
随着美团零售商品类业务的不断发展,美团搜索在多业务商品排序场景上面临着诸多的挑战。本文介绍了美团搜索在商品多业务排序上相关的探索以及实践,希望能对从事相关工作的同学有所帮助或者启发。
美团技术团队
2021/11/23
1.2K0
美团搜索多业务商品排序探索与实践
大厂技术实现 | 爱奇艺短视频推荐业务中的多目标优化实践 @推荐与计算广告系列
短视频是当前互联网最热门的业务之一,聚集了巨大的互联网用户流量,也是各大公司争相发展的业务领域。作为主要营收业务方向,短视频方向的推荐算法也日新月异并驱动业务增长,本期我们看到的是爱奇艺的短视频频道下,推荐多任务算法应用实践路径与落地方案。
ShowMeAI
2021/11/03
2.4K0
大厂技术实现 | 爱奇艺短视频推荐业务中的多目标优化实践 @推荐与计算广告系列
微信「看一看」多模型内容策略与召回
相信对于不少人而言微信已经成为获取资讯的主要场景。与此同时,由于微信用户群体的庞大,也吸引了大量的内容生产者在微信公共平台创造内容,以获取用户关注、点赞、收藏等。微信内的内容推荐产品:看一看应运而生。
week
2020/07/20
1.7K0
微信「看一看」多模型内容策略与召回
Facebook的多任务多模态向量召回模型Que2Search
对于一个搜索系统来说,通常采用的召回都是基于倒排索引的召回,简单来说就是需要对item侧建立倒排索引,在检索的过程中,对query分词,根据分词结果去倒排索引中查找词匹配的item,简单的流程如下图所示:
felixzhao
2023/04/01
1.5K0
Facebook的多任务多模态向量召回模型Que2Search
【CTR】Youtube:双塔召回模型
本文是 Google 在 RecSys 2019 上的最新论文,作者采用了目前主流的双塔模型,并基于此设计了一个使用双塔神经网络的建模框架,其中一个塔为 item 塔,编码了 item 大量的内容特征。
阿泽 Crz
2020/07/21
3.2K0
【CTR】Youtube:双塔召回模型
美团搜索粗排优化的探索与实践
总第528篇 2022年 第045篇 粗排是工业界搜广推系统的重要模块。美团搜索排序团队在优化粗排效果的探索和实践中,基于业务实际场景,从精排联动和效果性能联合优化两方面优化粗排,提升了粗排的效果。本文介绍了美团搜索粗排的迭代路线、基于知识蒸馏和自动神经网络选择的粗排优化工作,希望为从事相关工作的同学带来一些启发或者帮助。 1. 前言 2. 粗排演进路线 3. 粗排优化实践 3.1 精排联动效果优化 3.2 效果性能联合优化 4. 总结 5. 附录 1. 前言 众所周知,在搜索、推荐、广告等大规模工业界应
美团技术团队
2022/08/26
9800
美团搜索粗排优化的探索与实践
大规模异构图召回在美团到店推荐广告的应用
美团到店推荐广告团队在图神经网络的长期落地实践中,思考分析了场景的特点与挑战,针对性地进行了模型设计,并通过大规模训练工具及线上部署优化多次成功落地,带来了线上收入提升。本文主要介绍了大规模图召回技术在美团到店广告场景下的实践经验,包括模型设计思路、模型迭代历程、大规模训练工具以及线上部署性能优化等,希望为从事相关工作的读者带来一些启发。
美团技术团队
2022/12/16
9610
大规模异构图召回在美团到店推荐广告的应用
推荐阅读
相关推荐
得物社区推荐精排模型演进
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档