Loading [MathJax]/jax/element/mml/optable/GeneralPunctuation.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用户多兴趣建模MIND

用户多兴趣建模MIND

作者头像
felixzhao
发布于 2023-01-31 10:10:53
发布于 2023-01-31 10:10:53
6240
举报
文章被收录于专栏:null的专栏null的专栏

1. 概述

在工业界,一个完整的推荐系统中通常包括两个阶段,分别为召回阶段和排序阶段。在召回阶段,根据用户的兴趣从海量的商品中去检索出用户(User)可能感兴趣的候选商品( Item),满足推荐相关性和多样性需求。在排序阶段,根据不同的目标,如CTR,CVR,时长等对候选出的商品进行打分。目前,对于用户兴趣的建模,通常是从用户的历史行为中挖掘出用户兴趣,以当前的深度学习模型为例,通常是将User的历史行为数据embedding到一个固定长度的向量中,以此表示该用户的兴趣。然而在实际环境中,一个用户的兴趣通常是多样的,使用单一固定长度的embedding向量难以刻画用户兴趣的多样性。Multi-Interest Network with Dynamic routing[1](MIND)用户多兴趣建模网络取代了原先的单一固定长度embedding向量,取而代之的是用户的多兴趣向量。在MIND中,主要的创新点在于:

  1. 通过Mulit-Interest Extractor Layer获取User的多个兴趣向量表达,并采用动态路由(Dynamic Routing)的方法自适应地将User历史行为聚合到User兴趣表达向量中;
  2. 通过Label-Aware Attention机制,指导网络学习到用户的多兴趣Embedding向量;

2. 算法原理

2.1. MIND模型的网络结构

MIND模型的网络结构如下图所示:

MIND的网络结构与Youtube的召回网络结构[2]基本一致,Youtube的召回网络结构如下图所示:

不同点主要是在多兴趣抽取层Mulit-Interest Extractor Layer和Label-Aware Attention机制。

2.2. Mulit-Interest Extractor Layer

多兴趣抽取层的目的是对用户历史行为的item抽取出多个兴趣向量表达,通常采用聚类的过程将用户的历史行为聚类到多个簇中,一个簇中的item比较靠近,该簇代表了用户兴趣的一个方面。在MIND中,为了实现这样的聚类过程,使用到了胶囊网络(Capsule Network)。

2.2.1. 胶囊网络(Capsule Network)

什么是胶囊网络(Capsule Network)呢?参照参考[3],对胶囊网络做简单介绍。对于一个普通的神经网络是由神经元组成,每个神经元中是一个具体的值,如下图的左侧图所示;而在胶囊网络中是由被称为Capsule的基本单元组成,与神经元不同的是Capsule中存储的是向量,如下图的右侧图所示。

在上图的胶囊网络中,蓝色的Capsule的输入是黄色的Capsule和绿色的Capsule的输出,分别为向量

v1

和向量

v2

,蓝色的Capsule的输出是向量

v

2.2.2. 动态路由(Dynamic Routing)

在神经网络中,网络的权重

w1,w2,,wn

是在网络的backpropagation过程中学习到的。对于胶囊网络,其过程与神经网络有点不一样,借鉴参考[3]中的图,结合参考[1]中的实例,有如下的图:

假设存在两层的胶囊,当前的第

h

层的胶囊如上图中的蓝色部分,其输入为第

l

层,且上层的输出向量为

cliRNl×1

,且

i{1,,m}

,对应到第

h

层的输出向量为

chjRNh×1

,且

j{1,,n}

,在上图中,我们选取其中一个第

h

层的输出向量

chj

zhj

的计算过程如下:

zhj=mi=1wijSijcli

其中,矩阵

SijRNh×Nl

是需要学习的参数,可通过网络的backpropagation过程学习,连接权重

wij

在胶囊网络中被称为coupling coefficients,不是在网络中学习得到的。最终通过一个非线性的squash函数得到最终的胶囊的输出向量

chj

Squash函数的作用是相当于对向量

做归一化的操作,当至此完成了胶囊网络的前馈过程,然而对于连接权重却并不知道是如何得到的,为了求得连接权重需要使用到动态路由(dynamic routing)的过程,动态路由其实是一个迭代的过程,首先定义the routing logit

那么,

可以由

定义:

具体过程如下面的伪代码所示:

2.2.3. 如何理解聚类过程

在参考[4]中详细论述了动态路由与K-Means聚类算法之间的关系,简单来说Capsule所使用的聚类算法,其实是K-Means的变种。通过直观的理解这个过程,首先对于K-Means,为了与上面的Dynamic Routing过程对应,假设原始的样本为

,其中

,存在

个聚类中心

,其中

,K-Means的目标是将

个原始样本

划分到

个类中,使得类内的间隔最小,即:

其中

表示样本

是否属于聚类

,因此

。聚类中心

为:

与Dynamic Routing中的

的更新有两点不一样,第一,计算

的方式,第二是计算最后结果,在K-Means中是直接求平均,而在Dynamic Routing中,

采用的是squash函数。

上述只是从直观上对比了两个过程,具体的数学上的论述可以参见参考[4]。

2.2.4. 动态兴趣个数

对于不同的用户,其兴趣的个数

是不一样的,在参考[1]中给出了计算特定用户

的兴趣个数

2.3. Label-aware Attention Layer.

通过多兴趣提取器层,对用户行为序列得到了用户的多个兴趣向量,为了评估多个兴趣向量对目标Item相关度及贡献度,在[1]中设计Label-aware Attention机制来衡量目标Item选择使用哪个兴趣向量,其具体的表达式如下:

其中,

表示的是指数函数,

是一个调节attention分布的参数。

3. 总结

在MIND中,通过Mulit-Interest Extractor Layer获取User的多个兴趣向量表达,并采用动态路由(Dynamic Routing)的方法自适应地将User历史行为聚合到User兴趣表达向量中;最后通过Label-Aware Attention机制,指导网络学习到用户的多兴趣Embedding向量。

参考文献

[1] Li C, Liu Z, Wu M, et al. Multi-interest network with dynamic routing for recommendation at Tmall[C]//Proceedings of the 28th ACM international conference on information and knowledge management. 2019: 2615-2623.

[2] Covington P, Adams J, Sargin E. Deep neural networks for youtube recommendations[C]//Proceedings of the 10th ACM conference on recommender systems. 2016: 191-198.

[3] 14.胶囊网络(Capsule Network)

[4] 再来一顿贺岁宴:从K-Means到Capsule

[5]. 推荐系统召回模型之MIND用户多兴趣网络

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-01-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
更快的Maven来了,我的天,速度提升了8倍!
周末被 maven-mvnd 刷屏了,于是我也下载了一个 mvnd 体验了一把。虽然测试的数据都是基于我本地项目,不具备普适性和权威性,但也足以说明问题。它的测试结果远远超出我的预期,下面一起来看。
磊哥
2021/12/28
2.5K0
更快的Maven来了,我的天,速度提升了8倍!
【工具系列】mvnd:maven全新构建插件,提高性能
早上打包项目的时候发现打包速度很慢,耗时颇久,就在一个群里求助,如何使maven打包效率加快,一个群友发来一个链接,如图。
框架师
2022/03/08
1.7K0
【工具系列】mvnd:maven全新构建插件,提高性能
新版Maven—mvnd的使用测试
Maven、gradle 作为主流的构建工具,几乎所有的Java项目都使用,但是Maven相对gradle来说,构建还是太慢了。特别是构建十几个子项目的程序。
HaC
2022/04/13
1.9K0
新版Maven—mvnd的使用测试
干掉Maven和Gradle!新一代更强更快的构建工具,炸裂!
相信作为Java开发者的你早已经受够了maven的编译缓慢,但是又由于历史包袱、使用习惯等问题暂时切换不了其他更快的构建工具,这里笔者将给你介绍一款更快的maven——maven-mvnd。
搜云库技术团队
2022/02/17
4040
干掉Maven和Gradle!新一代更强更快的构建工具,炸裂!
换掉 Maven 和 Gradle:Maven 推出新一代构建工具,构建速度太快了,亲测好用!
当我们使用 Maven 构建项目时,通常需要启动 Maven 进行编译、测试和打包等操作,而 Maven 传统的构建太慢了,所以 Maven 新起了一个 maven-mvnd 项目,它的宗旨就是,借鉴来自 Gradle 和 Takari 中的技术以提供更快的 Maven 构建速度。
Java技术栈
2023/09/06
1K0
换掉 Maven 和 Gradle:Maven 推出新一代构建工具,构建速度太快了,亲测好用!
Maven官宣:干掉Maven和Gradle!推出更强更快更牛逼的新一代构建工具,炸裂!
点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网络应用框架 Netty 源码解析 消息中间件 RocketMQ 源码解析 数据库中间件 Sharding-JDBC 和 MyCAT 源码解析 作业调度中间件 Elastic-Job 源码解析 分布式事务中间件 TCC-Transaction
芋道源码
2022/03/04
3450
更快的 Maven 来了!!!性能提升 300%
前几天在 GitHub 上闲逛的时候,发现了一个新的项目:maven-mvnd,可以读作 Maven Daemon,译作 Maven 守护版,旨在为 Maven 提供更快的构建速度,灵感借鉴了 Gradle 和 Takari(Maven 生命周期优化器)。
沉默王二
2021/12/29
8931
更快的 Maven 来了!!!性能提升 300%
mvnd 安装和配置
兮动人
2024/03/17
9100
mvnd 安装和配置
更快的Maven来了
Maven经常被拿来和Gradle做对比,最大的劣势之一就是Maven构建慢,Gradle比Maven构建速度快2到10倍,而如今Maven也可以更快了。Apache Maven团队从Gradle和Takari(Maven生命周期优化器)[1]中获得灵感对Maven进行了强化,衍生出 maven-mvnd[2]项目。点赞、再看、转发走一波,胖哥带你玩新东西。
码农小胖哥
2021/12/27
7650
更快的Maven来了
从0到1教你学Maven(全网最详细)(二)下载安装maven,并且实现配置,创建第一个maven项目
需要从maven的官网下载maven的安装包 apache-maven-3.3.9-bin.zip
一写代码就开心
2021/03/02
5590
从0到1教你学Maven(全网最详细)(二)下载安装maven,并且实现配置,创建第一个maven项目
详解Maven用户的配置settings.xml
包括不应与pom.xml文件一起分发的内容,例如开发人员身份,以及本地设置,如代理信息。
jack.yang
2025/04/05
2380
SpringCloud入门之Maven系统安装及配置
这个单词中文翻译为“专家”或“内行”。下面将向你介绍 Maven这一跨平台的项目管理工具。作为 Apache 组织中的一个成功的开源项目,Maven 主要服务于基 Java 平台的项目构建、依赖管理和项目信息管理。无论是小型的开源类库项目,还是大型的企业级应用;无论是传统的瀑布式开发,还是流行的敏捷模式,Maven 都能大显身手。它是一个异常强大的构建工具,能够帮我们自动化构建过程,从清理、编译、测试到生成报告,再到打包和部署。我们不需要也不应该一遍又一遍地输入命令,一次又一次地点击鼠标,我们要做的是使用 Maven 配置好项目,然后输入简单的命令(如mvn clean install),Maven 会帮我们处理那些烦琐的任务。Maven 是跨平台的,这意味着无论是在 Windows 上,还是在 Linux 或者 Mac 上,都可以使用同样的命令。我们一直在不停地寻找避免重复的方法。设计的重复、编码的重复、文档的重复,当然还有构建的重复。Maven 最大化地消除了构建的重复,抽象了构建生命周期,并且为绝大部分的构建任务提供已实现的插件,我们不再需要定义过程,甚至不需要再去实现这些过程中的一些任务。最简单的例子是测试,我们没必要告诉 Maven 去测试,更不需要告诉 Maven 如何运行测试,只需要遵循 Maven的约定编写好测试用例,当我们运行构建的时候,这些测试便会自动运行。想象一下,Maven 抽象了一个完整的构建生命周期模型,这个模型吸取了大量其他的构建脚本和构建工具的优点,总结了大量项目的实际需求。如果遵循这个模型,可以避免很多不必要的错误,可以直接使用大量成熟的 Maven 插件来完成我们的任务(很多时候我们可能都不知道自己在使用Maven 插件)。此外,如果有非常特殊的需求,我们也可以轻松实现自己的插件。Maven 还有一个优点,它能帮助我们标准化构建过程。在 Maven 之前,十个项目可能有十种构建方式;有了 Maven 之后,所有项目的构建命令都是简单一致的,这极大地避免了不必要的学习成本,而且有利于促进项目团队的标准化。综上所述,Maven 作为一个构建工具,不仅能帮我们自动化构建,还能够抽象构建过程,提供构建任务实现;它跨平台,对外提供了一致的操作接口,这一切足以使它成为优秀的、流行的构建工具。
jack.yang
2025/04/05
1420
SpringCloud入门之Maven系统安装及配置
Spring6和SpringBoot3的新特性-你不得不了解的AOT原来这么简单
  AOT是Spring6.0提供的一个新特性,Ahead of Time 提前编译。
用户4919348
2023/05/27
3.3K0
Spring6和SpringBoot3的新特性-你不得不了解的AOT原来这么简单
Maven安装与配置
下载地址:http://maven.apache.org/download.cgi
布禾
2020/10/29
1.1K0
Maven安装与配置
maven_01_简介及安装
除了编写源代码,我们每天有相当一部分时间花在了编译、运行单元测试、生成文档、打包和部署等烦琐且不起眼的工作上,这就是构建。
shirayner
2019/03/04
3960
maven_01_简介及安装
maven全局配置文件settings.xml详解
静默虚空
2018/01/05
20.5K0
maven全局配置文件settings.xml详解
Maven的这三个用法你一定要会
本文中将介绍maven的自定义插件(入门实战)自定义archeType模板(实战)按环境打包(实战)三个在私服中常常需用的操作。
IT大咖说
2019/11/07
7270
Maven的这三个用法你一定要会
OpenFaaS实战之八:自制模板(maven+jdk8)
如果您不想自己搭建kubernetes环境,推荐使用腾讯云容器服务TKE:无需自建,即可在腾讯云上使用稳定, 安全,高效,灵活扩展的 Kubernetes 容器平台;
程序员欣宸
2021/09/14
6190
OpenFaaS实战之八:自制模板(maven+jdk8)
更快的Maven构建工具mvnd和Gradle哪个更快?
Maven 作为经典的项目构建工具相信很多人已经用很久了,但如果体验过 Gradle,那感觉只有两个字“真香”。 前段时间测评了更快的 Maven 构建工具 mvnd,感觉性能挺高的,貌似有了种“没必要再用 Gradle”的感觉了,而本文通过三者的性能对比,告诉你到底谁才是王者。
磊哥
2022/05/09
9500
更快的Maven构建工具mvnd和Gradle哪个更快?
Maven详细介绍
如何回答这个问题要看你怎么看这个问题。 绝大部分Maven用户都称Maven是一个"构建工具":一个用来把源代码构建成可发布的构件的工具。 构建工程师和项目经理会说 Maven是一个更复杂的东西:一个项目管理工具。那么区别是什么? 像Ant这样的构建 工具仅仅是关注预处理,编译,打包,测试和分发。像 Maven 这样的一个项目管理工 具提供了构建工具所提供功能的超集。 除了提供构建的功能,Maven还可以生成报告, 生成Web站点,并且帮助推动工作团 队成员间的交流。一个更正式的 Apache Maven 1 的定义: Maven是一个项目管理工具,它包含了一个项目对象模型 (Project Object Model),一组标准集合,一个项目生命周期(ProjectLifecycle),一个依赖管理系统(Dependency Management System),和用来运行定义在生命周期阶段(phase)中插件(plugin)目标(goal)的逻辑。 当你使用Maven的时候,你用一个明确定义的项目对象模型来描述你的项目,然后 Maven 可以应用横切的逻辑,这些逻辑来自一组共享的(或者自定义的)插件。别让Maven是一个"项目管理"工具的事实吓跑你。如果你只是在找一个构建工具,Maven能做这个工作。 事实上,本书的一些章节将会涉及使用Maven来构建和分发你的项目。
WindWant
2020/09/11
2.7K0
Maven详细介绍
推荐阅读
相关推荐
更快的Maven来了,我的天,速度提升了8倍!
更多 >
LV.1
这个人很懒,什么都没有留下~
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档