Loading [MathJax]/jax/element/mml/optable/GeneralPunctuation.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems

『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems

作者头像
百川AI
发布于 2022-05-15 03:21:28
发布于 2022-05-15 03:21:28
1.1K0
举报
文章被收录于专栏:我还不懂对话我还不懂对话

Abstract

MULTI-VIEW-DNN联合了多个域做的丰富特征,使用multi-view DNN模型构建推荐,包括app、新闻、电影和TV,相比于最好的算法,老用户提升49%,新用户提升110%。并且可以轻松的涵盖大量用户,解决冷启动问题。

主要做user embedding的过程,通多用户在多个域的行为作为一个ivew,来表征用户,参与用户embedding过程。

Contribution

  1. 利用丰富的用户特征,建立多用途的用户推荐系统
  2. 针对基于内容的推荐,提出了一种深度学习方法。并学习不同的技术扩展推荐系统。
  3. 结合不同领域的数据,提出了Multi-View DNN模型建立推荐系统。
  4. multi-view DNN模型解决用户冷启动问题。
  5. 基于四个真实的大规模数据集,通过严格的实验证明所提出的推荐系统的有效性。

Data Set

Type

DataSet

UserCnt

FeatureSize

Joint Users

User view

Search

20M

3.5M

/

Item View

News Apps Movie/TV

5M 1M 60K

100K 50K 50K

1.5M 210K 60K

DSSM FOR USER MODELING IN RECOMMENDATION SYSTEMS

deep structured semantic model参考Learning deep structured semantic models for web search using clickthrough data

结构图:

  1. 把条目映射成低维向量。
  2. 计算查询和文档的cosine相似度。

其中:

l1=W1x
li=f(Wili1+bi),i=2,...,N1
y=f(WNlN1+bN)

word hashing

通过word hashing层将word映射为稠密向量。以good为例。

  1. 添加首尾标记: #good#
  2. 拆分word为n-grams: #go, goo, ood, od#
  3. 通过多个小的n-grams的向量表示word。

这种方法即使有新词出现,也不会出现问题。

DSSM训练

对于一次搜索,如果点击了一个文档,认为他们是相关的。对于搜索查询集,DSSM去最大化被点击文档D+ 条件似然概率**。

其中D是全集, 是平滑因子。损失函数自然就是:

MULTI-VIEW DEEP NEURAL NETWORK

对于User view,计算User View和Item View之间的 ,然后最小化:

其中P()定义为:

Data input

对于第j行输入数据,它的主域 和一个激活View ,其余的View输入 都为0向量。

User features

  • search queries:规范化,然后处理成unigram格式。
  • clicked URLs:只保留主域名,如www.linkdin.com

News features

news article clicks:

  1. title( tri-gram)
  2. top-level category(binary features)
  3. named entities

App features

App download histories:

  1. App tile( tri-gram)
  2. category(binary)

Movie/TV feature

movie/TV view history

  1. title( tri-gram)
  2. description( tri-gram)
  3. genre(binary)

训练过程

训练目标:

原文公式:

训练目标:

最小化L()为目标得到 ,即网络的参数矩阵。

MV-DNN优势

  1. 和DSSM相比,其query和doc的feature是一样长的维度,使用同样的预处理,限制了feature。而跨域信息feature往往不同,而且n-gram方法并不适用,所以MV-DNN结合其类别特征(如电影和app类别,地理位置等)。
  2. MV-DNN可以结合多个跨域信息,实现对user embedding。pair-wise training过程,user-item pairs。

降维方法

top features

对于user features,选取top-k最频繁的features。并通过TF-IDF过滤掉最常用的特征。

k-means

k-mean会指定k为类簇的个数,目标是最小化所有类簇点与中心点的距离只和。公式表达:

其中 是数据点, 是每个类簇的中心。通过K-means对相似的特征群分组为同一个cluster并生成新的特征,共生产k个新的特征。

应用:

对于输入数据矩阵X,shape=[size=n, dimension=k],划分为 ,然后将每个 归一化,对 使用k-means聚类, 之间计算距离用cos相似度。然后就可以将特征降维到k维,对于每个新的特征向量 有:

比如原始维度是3.5M,设置k=10k,那么将为之后维度就是10k。

Local sensitive Hashing

通过一个随机的矩阵将数据映射到低纬向量空间上,并且保持原始空间上的pairwis cos距离在新的空间上仍然获得保留。

原始维度d,降维到k,那么映射矩阵 ,即A包含了k个映射,每个映射 都将X映射为 ,输出为 。计算 的公式为:

计算 的cos相似度近似表示为:

,其中 表示汉明距离,论文选取的k=10000.

Reduce the Number of Training Examples

每个用户在每个域都有大量的日志数据,将每个用户在每个域只选取一个user-item对,具体为用户特征-用户在此域喜欢的所有item的平均分数。

CONCLUSION AND FUTURE WORK

本文提出了一种通用的结合丰富用户特征和item特征的推荐系统框架,通过结合多个域的丰富信息,是的推荐系统的质量极大提高,并且此方法通过降维的方法可扩展到大的数据集,同时对于老用户和新用户都适用推荐,在几个公开的大数据集上的表现都明显优于其他方法。

此框架可以应用于各个推荐系统,未来还需要:

  1. 纳入更多的用户特征。
  2. 增加DNN扩展性,以便不在使用特征降维的方法。
  3. 加入更多的域并深入分析它的表现。
  4. 如何将协同过滤方法和本文的基于内容的方法结合。

代码

DSSM & Multi-view DSSM代码 https://github.com/InsaneLife/dssm Multi-view DSSM实现,参考GitHubmulti_view_dssm_v3 CSDN原文:http://blog.csdn.net/shine19930820/article/details/78810984

Model DSSM on Tensorflow

代码: https://github.com/liaha/dssm

keras实现

Reference

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-12-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
MULTI-VIEW-DNN联合了多个域做的丰富特征,使用multi-view DNN模型构建推荐,包括app、新闻、电影和TV,相比于最好的算法,老用户提升49%,新用户提升110%。并且可以轻松的涵盖大量用户,解决冷启动问题。
felixzhao
2019/06/24
1.6K0
『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
DSSM & Multi-view DSSM TensorFlow实现
Learning Deep Structured Semantic Models for Web Search using Clickthrough Data以及其后续文章
百川AI
2021/10/19
1.1K0
Ada-Ranker:咱就说咱能根据数据分布自适应,不信瞧瞧?
现在主流的排序模型设计和使用方式是:离线训练模型,冻结参数,并将其部署到在线服务。但是实际上,候选商品是由特定的用户请求决定的,其中潜在的分布(例如,不同类别的商品比例,流行度或新商品的比例)在生产环境中彼此之间存在很大差异。经典的参数冻结推理方式无法适应动态服务环境,使得排序模型的表现受到影响。
秋枫学习笔记
2022/09/19
5520
深度学习算法原理——Deep Structured Semantic Models(DSSM)
论文地址:Learning deep structured semantic models for web search using clickthrough data
felixzhao
2019/06/24
2.1K0
深度学习算法原理——Deep Structured Semantic Models(DSSM)
深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比
CTR预估是目前推荐系统的核心技术,其目标是预估用户点击推荐内容的概率。DeepFM模型包含FM和DNN两部分,FM模型可以抽取low-order(低阶)特征,DNN可以抽取high-order(高阶)特征。低阶特征可以理解为线性的特征组合,高阶特征,可以理解为经过多次线性-非线性组合操作之后形成的特征,为高度抽象特征。无需Wide&Deep模型人工特征工程。由于输入仅为原始特征,而且FM和DNN共享输入向量特征,DeepFM模型训练速度很快。
汀丶人工智能
2023/06/13
1.3K0
深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比
【深度学习算法原理】Deep Structured Semantic Models(DSSM)
深度语义模型(Deep Structured Sematic models, DSSM)是在2013年由微软的研究人员提出,主要解决的是在搜索的过程中,对于传统的依靠关键词匹配的方法的弊端(语义上的相似)提出的潜在语义模型。DSSM算法在实际工作中也被证明是卓有成效的算法,不仅在搜索中得到广泛的应用,同时也被使用在推荐系统的召回中。
felixzhao
2022/03/04
8480
【深度学习算法原理】Deep Structured Semantic Models(DSSM)
CIKM'21序列推荐|基于区域的embedding捕获用户行为中的偏好
可以先看背景和总结部分,对整个文章做的工作进行了简单的概括,公式太长的可以左右滑动哦~
秋枫学习笔记
2022/09/19
5170
【每周NLP论文推荐】 介绍语义匹配中的经典文章
欢迎来到《每周NLP论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。
用户1508658
2019/08/20
1.3K0
【每周NLP论文推荐】 介绍语义匹配中的经典文章
CIKM'22 | 序列推荐中的多层次对比学习框架
本文主要针对序列推荐中的数据稀疏问题提出相应的解决方法,针对现有对比学习在缓解该问题上的不足提出MCLSR。现有方法的不足:由于对复杂的协作信息(例如用户-商品关系、用户-用户关系和商品-商品关系)的建模不足,学习信息丰富的用户/商品embedding还远远不够。本文提出了一种新的用于序列推荐的多层次对比学习框架,称为 MCLSR。与之前基于对比学习的 SR 方法不同,MCLSR 通过跨视图对比学习范式从两个不同级别(即兴趣级别和特征级别)的四个特定视图学习用户和商品的表征。具体来说,兴趣级对比机制与顺序转换模式共同学习协作信息,特征级对比机制通过捕获共现信息重新观察用户和商品之间的关系。
秋枫学习笔记
2023/01/30
1.1K0
推荐系统(十六)——FM全家桶(1),FM,FFM,DeepFM,NFM,AFM
因子分解机(Factorization Machines,FM)及其变种已经在推荐系统中得到了广泛的应用,本文就FM的系列模型进行简单总结。
秋枫学习笔记
2022/09/19
1.2K0
SIGIR'22「eBay」MP2:动量对比框架缓解推荐系统中的标注偏差
现有的推荐系统模型训练通常采用point wise(如交叉熵)或pair wise损失(如BPR),但是标签的有限的表达能力可能无法适应不同程度的用户偏好,从而导致模型训练期间的冲突,作者称之为标注偏差(annotation bias)。
秋枫学习笔记
2022/09/19
5390
推荐系统(二十一)DIN系列——DIN、DIEN、DSIN深度兴趣网络总结
本文为阿里DIN系列方法的简单总结,这里将会总结DIN系列文章的创新之处,以及相应的方法。DIN提出的原因我们在base model里面介绍。
秋枫学习笔记
2022/09/19
3.3K0
专栏 | 云脑科技-实习僧文本匹配模型及基于百度PaddlePaddle的应用
机器之心发布 云脑科技 作者:算法工程师 李瀚立 作者简介:李瀚立,本科毕业于武汉大学数学与统计学院,普渡大学统计硕士,达特茅斯学院计算机硕士。曾就职于 Amazon AWS,IBM Cloud。现为
机器之心
2018/06/08
8020
DSSM、Youtube_DNN、SASRec、PinSAGE…你都掌握了吗?一文总结推荐系统必备经典模型(一)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 18 个在推荐系统任务上曾取得 SOTA 的经典模型。 第 1 期:DSSM、Youtube_DNN、SASRec、PinSAGE、TDM
机器之心
2023/03/29
1.6K0
DSSM、Youtube_DNN、SASRec、PinSAGE…你都掌握了吗?一文总结推荐系统必备经典模型(一)
ICDE'21「京东」推荐系统:多行为融合的图神经网络GNMR
在实际生活中,用户的行为通常是多样的,比如点击,购买,浏览等,而对于这些多类型的行为,常见的面向单行为的推荐方法是不具备优势的,因此本文提出了基于图神经网络的多行为推荐方法GNMR。
秋枫学习笔记
2022/09/19
9960
【论文笔记】A Graph-based and Copy-augmented Multi-domain Dialogue State Tracking
​ 大多数现有的方法都在单个领域上独立训练 DST,而忽略了跨领域之间的信息的有效共享。
yhlin
2023/03/23
8740
【论文笔记】A Graph-based and Copy-augmented Multi-domain Dialogue State Tracking
SIGIR'22「腾讯」GMT:邻域感知的Masked Transformer进行点击率预测
本文针对点击率CTR预估提出新方法GMT,推荐系统的性能通常受到不活跃行为和系统曝光的影响,导致提取的特征没有包含足够的信息。本文提出基于邻域交互的CTR预测方法,通过异构信息网络HIN挖掘目标用户-商品对的局部邻域来预测他们的链接。并且,考虑节点之间的四种拓扑交互来增强局部邻域表征。
秋枫学习笔记
2022/09/19
4550
【深度语义匹配模型 】原理篇一:表示型
工业界的很多应用都有在语义上衡量本文相似度的需求,直接目标就是判断两句话是否表达了相同或相似意思,我们将这类需求统称为“语义匹配”,nlp中的许多任务都可以抽象为语义匹配任务。语义匹配的相关应用场景主要有搜索引擎、问答系统、推荐系统、文本去重等,主要是为了找到与目标文本最相关的文本,比如在问答系统中找到和问题最相关的答案,在搜索引擎中找到与搜索框中关键词最相关的网页等。
zenRRan
2020/05/26
5.3K0
【论文阅读】GETNext:Trajectory Flow Map Enhanced Transformer for Next POI Recommendation
authors:: Song Yang, Jiamou Liu, Kaiqi Zhao container:: Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval year:: 2022 DOI:: 10.1145/3477495.3531983 rating:: ⭐⭐️⭐️ share:: false comment:: 论文的主干网络仍然是 Transformer,通过构建 POI 之间的转移权重图(trajectory flow map)并通过 GCN 进行 POI Embedding;最后,又同时预测 POI、时间、类别,加强了损失函数。
EmoryHuang
2022/10/31
8180
【论文阅读】GETNext:Trajectory Flow Map Enhanced Transformer for Next POI Recommendation
文本匹配开山之作--双塔模型及实战
在前面一篇文章中,总结了Representation-Based文本匹配模型的改进方法,
NewBeeNLP
2021/08/20
1.2K0
推荐阅读
『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
1.6K0
DSSM & Multi-view DSSM TensorFlow实现
1.1K0
Ada-Ranker:咱就说咱能根据数据分布自适应,不信瞧瞧?
5520
深度学习算法原理——Deep Structured Semantic Models(DSSM)
2.1K0
深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比
1.3K0
【深度学习算法原理】Deep Structured Semantic Models(DSSM)
8480
CIKM'21序列推荐|基于区域的embedding捕获用户行为中的偏好
5170
【每周NLP论文推荐】 介绍语义匹配中的经典文章
1.3K0
CIKM'22 | 序列推荐中的多层次对比学习框架
1.1K0
推荐系统(十六)——FM全家桶(1),FM,FFM,DeepFM,NFM,AFM
1.2K0
SIGIR'22「eBay」MP2:动量对比框架缓解推荐系统中的标注偏差
5390
推荐系统(二十一)DIN系列——DIN、DIEN、DSIN深度兴趣网络总结
3.3K0
专栏 | 云脑科技-实习僧文本匹配模型及基于百度PaddlePaddle的应用
8020
DSSM、Youtube_DNN、SASRec、PinSAGE…你都掌握了吗?一文总结推荐系统必备经典模型(一)
1.6K0
ICDE'21「京东」推荐系统:多行为融合的图神经网络GNMR
9960
【论文笔记】A Graph-based and Copy-augmented Multi-domain Dialogue State Tracking
8740
SIGIR'22「腾讯」GMT:邻域感知的Masked Transformer进行点击率预测
4550
【深度语义匹配模型 】原理篇一:表示型
5.3K0
【论文阅读】GETNext:Trajectory Flow Map Enhanced Transformer for Next POI Recommendation
8180
文本匹配开山之作--双塔模型及实战
1.2K0
相关推荐
『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档