视频推荐能力第二讲

文章来源：企鹅号 - 德塔大数据研究院

整理人：孙一欣

上一章讲了视频推荐系统的“挖掘利用”的算法与原理，接下来讲一下“探索与发现”的基本目标和算法。

首先讲的是关于相关性和多样性之间的一种平衡：

如果我们把用户的兴趣，想象成一个蓝色的曲线，那么有的用户兴趣是比较简单的，显示为单峰分布，但是大部分用户兴趣都是多峰的，在这些不同的兴趣中有的峰值会比较高，有的峰值会比较低，代表了用户的显性的兴趣和比较隐藏的兴趣。

为了能够满足用户隐藏的兴趣点，发现多峰分布的那些隐藏的峰值。业界就推出了这种启发式的方法:把优化目标从仅仅是优化相关性，就是左边这项，再加上了后面多样性的一项，就是标黄色的这一项,然后使用一种迭代尝试的方法最大化这种差异，这样就可以平衡相关性和多样性。

一种创新的方法叫做DPP：相对于刚才的启发式算法的改进：把原来的两两相比较的多样性等式，改变成一种集合的整体比较。即把内容向量之间章程多面体的体积最大化，而不仅仅是两两向量之间的夹角求和最大化。

基于这种算法我们观测到了更高的准确度，但是与此同时它的计算复杂度也增加了。所以如果按照传统的DPP算法直接取消线上运行的话，发现它接到的复杂度是N立方的，N就是你要选择的推荐物品数。

“探索发现”的算法先讲到这里，接下来讲一下用户体验。

推荐的理由：用户点击推荐的信息，一方面是由于相关性高，另外一方面是由于对推荐系统本身的信心。那么如何让用户对推荐系统有信心，就需要给出一个合理的解释，而不仅仅是给出一个比较冷冰冰的排名。

对于高质量的推荐的理由，我们需要构建一个推荐的知识图谱。其中包括对用户数据的理解，包括统计的数据，以及物品之间的实体图谱。

这个知识图谱可以用n元组的方式来表达。其中的内容知识包括：当前这个剧属于哪一类，它在什么日期发布的，它的作者，以及它获过哪些奖。用户数据包括：谁看了那个剧，它属于哪一类，用户画像。统计数据包括：当前剧的流行程度等。

基于这个n元组，我们可以去做推理。这里举了一些推理规则的例子，比如说一个用户喜欢剧一，那么有可能是因为这个用户属于程序员这一组，然后程序员这一组里面有喜欢剧二的人很多，然后剧一和剧二又很相近，所以用户会喜欢剧二这样多层的一个语义的推理。

具体来讲这个推理的过程，可以用一个树状结构来展开。我们在构建了一个知识图谱之后，在职图谱中的各个实体之间做这个推理树。在推理树中找到最有可能的路径，形成我们推荐的理由。

在传统的用户界面里面，用户想要做比较复杂的条件选择，那就只能用这种多级菜单的方式，这时候浏览起来不是很方便，特别是在手机的小屏幕上就更加困难。而语音大大简化了这种多级菜单条件，用户只要一句话就可以把很多复杂条件做合并。比如说我要看一部八十年代有关三角恋的一个感情戏，那么就是同时合并了多种条件，但并没有给用户造成更复杂的一个操作。用户还可以根据上下文，让推荐的过程变得和交谈一样轻松。比如说刚才的那个条件返回了几步结果，那么用户可以进一步说，我喜欢更短一点儿的结果，那么我们可以马上把上面的推荐结果，做进一步的筛选。

语音交互将是引领下一代计算技术的一个交互方式。事实上如果大家回顾计算技术的几代革命，都是由和交互方式的革命相连的。PC时代我们使用的是鼠标和键盘。接下来移动计算的时代，我们有了多点触控，使得手机从根本上产生更加自然的体验。那么我觉得到了物联网的计算时代，语音交互将是下一代的交互方式。

数据来源：“基于人工智能的下一代视频推荐系统”演讲

演讲人：周涵宁

《浅谈大数据第一期》

德塔 | 专家团队

干货 | 共41篇

转载请注明出处

DaaS慧报（有温度的大数据报告）

大数据落地方案

大数据思想

主编：林帅兵|德塔大数据研究院院长

责任编辑：孙一欣

责任美编：彭琦

德塔大数据研究院专家团队

师文轩|德塔大学名誉校长

李智博/董旭/李宝环/王凤君/孙一欣/林帅兵 ……

欢迎在下方留言，“塔塔”会在第一时间回复您！

发表于: 2017-12-212017-12-21 14:30:00
原文链接：http://kuaibao.qq.com/s/20171221B0E6DY00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

视频推荐能力第二讲

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐