整理人:孙一欣
版权所有©德塔精要,转载请注明出处
上一章讲了视频推荐系统的“挖掘利用”的算法与原理,接下来讲一下“探索与发现”的基本目标和算法。
首先讲的是关于相关性和多样性之间的一种平衡:
如果我们把用户的兴趣,想象成一个蓝色的曲线,那么有的用户兴趣是比较简单的,显示为单峰分布,但是大部分用户兴趣都是多峰的,在这些不同的兴趣中有的峰值会比较高,有的峰值会比较低,代表了用户的显性的兴趣和比较隐藏的兴趣。
为了能够满足用户隐藏的兴趣点,发现多峰分布的那些隐藏的峰值。业界就推出了这种启发式的方法:把优化目标从仅仅是优化相关性,就是左边这项,再加上了后面多样性的一项,就是标黄色的这一项,然后使用一种迭代尝试的方法最大化这种差异,这样就可以平衡相关性和多样性。
一种创新的方法叫做DPP:相对于刚才的启发式算法的改进:把原来的两两相比较的多样性等式,改变成一种集合的整体比较。即把内容向量之间章程多面体的体积最大化,而不仅仅是两两向量之间的夹角求和最大化。
基于这种算法我们观测到了更高的准确度,但是与此同时它的计算复杂度也增加了。所以如果按照传统的DPP算法直接取消线上运行的话,发现它接到的复杂度是N立方的,N就是你要选择的推荐物品数。
“探索发现”的算法先讲到这里,接下来讲一下用户体验。
推荐的理由:用户点击推荐的信息,一方面是由于相关性高,另外一方面是由于对推荐系统本身的信心。那么如何让用户对推荐系统有信心,就需要给出一个合理的解释,而不仅仅是给出一个比较冷冰冰的排名。
对于高质量的推荐的理由,我们需要构建一个推荐的知识图谱。其中包括对用户数据的理解,包括统计的数据,以及物品之间的实体图谱。
这个知识图谱可以用n元组的方式来表达。其中的内容知识包括:当前这个剧属于哪一类,它在什么日期发布的,它的作者,以及它获过哪些奖。用户数据包括:谁看了那个剧,它属于哪一类,用户画像。统计数据包括:当前剧的流行程度等。
基于这个n元组,我们可以去做推理。这里举了一些推理规则的例子,比如说一个用户喜欢剧一,那么有可能是因为这个用户属于程序员这一组,然后程序员这一组里面有喜欢剧二的人很多,然后剧一和剧二又很相近,所以用户会喜欢剧二这样多层的一个语义的推理。
具体来讲这个推理的过程,可以用一个树状结构来展开。我们在构建了一个知识图谱之后,在职图谱中的各个实体之间做这个推理树。在推理树中找到最有可能的路径,形成我们推荐的理由。
在传统的用户界面里面,用户想要做比较复杂的条件选择,那就只能用这种多级菜单的方式,这时候浏览起来不是很方便,特别是在手机的小屏幕上就更加困难。而语音大大简化了这种多级菜单条件,用户只要一句话就可以把很多复杂条件做合并。比如说我要看一部八十年代有关三角恋的一个感情戏,那么就是同时合并了多种条件,但并没有给用户造成更复杂的一个操作。用户还可以根据上下文,让推荐的过程变得和交谈一样轻松。比如说刚才的那个条件返回了几步结果,那么用户可以进一步说,我喜欢更短一点儿的结果,那么我们可以马上把上面的推荐结果,做进一步的筛选。
语音交互将是引领下一代计算技术的一个交互方式。事实上如果大家回顾计算技术的几代革命,都是由和交互方式的革命相连的。PC时代我们使用的是鼠标和键盘。接下来移动计算的时代,我们有了多点触控,使得手机从根本上产生更加自然的体验。那么我觉得到了物联网的计算时代,语音交互将是下一代的交互方式。
数据来源:“基于人工智能的下一代视频推荐系统”演讲
演讲人:周涵宁
《浅谈大数据第一期》
德塔 | 专家团队
干货 | 共41篇
版权所有©️德塔大数据研究院
转载请注明出处
DaaS慧报(有温度的大数据报告)
大数据落地方案
大数据思想
主编:林帅兵|德塔大数据研究院院长
责任编辑:孙一欣
责任美编:彭 琦
德塔大数据研究院专家团队
师文轩|德塔大学名誉校长
李智博/董旭/李宝环/王凤君/孙一欣/林帅兵 ……
欢迎在下方留言,“塔塔”会在第一时间回复您!
领取专属 10元无门槛券
私享最新 技术干货