YouTube用户每日观看小时数高达10亿小时,而每分钟就有超过500小时的视频被上传到YouTube平台中。其数据量之大,若真的要做到每位YouTube用户的个性化推荐与设计,的确有一定的难度。
对此,YouTube工程研发副总裁克里斯多·古德罗(Cristos Goodrow)说明,YouTube的工作之一,就是帮助用户在大量内容中主动提供他们想看的,从而改善他们的服务体验、提高其满意度,而至今全球YouTube用户的观看时间高达7成来自推荐视频。
而针对平台服务方面,谷歌也分享了YouTube优化平台服务的三大历程:
第一阶段(2011年-2012年):“观看时长”才是算法的重点
早在2011年,YouTube就留意到使用者的观看次数并不能真实反应出推荐的内容是否符合用户需求,因此这段时间,YouTube将重点放在“观看时长”(Watchtime)。虽然这么做导致了观看次数在一天内下降20%,但观看时间却从平均120秒提高到140秒,而如今证实这个想法是正确的,在2017年,YouTube上用户每日观看视频总时数已经达到10亿小时。从观看次数转为观看时数,代表YouTube更看重使用者的黏着度,也就是用户可能感兴趣的内容。
第二阶段(2014年-2015年):人工智能让个人化视频推荐更精准
随着移动用户的急剧攀升,当时已有超过60%的YouTube观看时间发生在智能手机和平板计算机上。为此,YouTube在这段时间针对移动装置进行优化,比方说在移动版中加入“再看一次”(Watchit Again)的功能;同时调整了首页页面的排版方式;同时透过谷歌大脑(GoogleBrain)团队导入人工智能技术,强化了人工智能推荐系统、提升视频推荐机制的准确,使到推荐视频更加个人化。
第三阶段(2016年-2017年):用户接口个人化
随着机器学习技术的成熟发展,让开发团队可以作出更多事情,YouTube在2016年至2017年内推出了超过190个更新。为了维持使用者观影新鲜感、提高满意度,YouTube持续优化个人使用体验,确保每个人都获得最新、最热门的内容推荐;同时,YouTube也将“个人化”的概念应用至使用者页面,并于2016年推出更新的YouTube移动版首页,接口设计比以往都更干净简洁,也在首页显示与用户更相关的YouTube个人化推荐视频。
针对YouTube优化方面,“YouTube搜寻与探索团队”随时在YouTube上准备高达100小时观众感兴趣的视频内容,并在YouTube首页上每天推荐高达2亿个不同类型的视频,涵盖了76种不同语言,让所有用户都感受到YouTube真的了解他们的喜好,其成果就是“超过七成的观看时间是来自观看YouTube自动推荐的视频内容”。若与三年前相比,使用者在YouTube首页点击推荐视频的观看时间成长了20倍。
由于每分钟有超过500小时的视频被上传到YouTube,因此推荐系统必须对最新上传的视频以及使用者最新行为拥有相当的反应能力。同时,从不断为使用者开发多元内容的角度来看,推荐系统也希望能平衡新的视频内容和现存的内容,作出更适合用户的推荐。
为此,谷歌这两年积极使用所谓TensorFlow的人工智能系统,TensorFlow是谷歌于2015年研发的人工智能学习系统,像是Gmail、谷歌相簿、谷歌翻译等都有其影子。在YouTube用户推荐系统当中,用户喜欢及不喜欢的视频都是训练数据,包括:使用者直接在视频下方点击“我喜欢”或“我不喜欢”的按钮,或其他隐性回馈讯号,例如用户完整看完一段视频等,都将会被TensorFlow基础上的学习视频推荐系统所读取。
古德罗指出,为了提供更好的用户推荐,团队搭建置了结合候选生成模型(Candidate Generation Model)与排名模型(Ranking Model)这两个神经网络的推荐系统。前者将数百万个视频数据缩小分成多个数百个与用户相关视频的数据子集,这些资料子集把许多变因都考虑进去,包括:浏览历史、搜寻历史以及人口变项信息(如年龄等)。而后者则会透过提名特征(Nominating Features)来下评分讯号的权重(Scoring Signals),相关热门推荐视频评分结果判断标准如下:
■人口统计信息(Demographic information),例如地理位置
■最受欢迎的视频(Most popular videos)
■用户和视频所使用的语言
■近期观看纪录
■使用者和该视频频道的过往连结
至于智能判断视频内容,并下架不雅内容这方面,主要来自YouTube认为“恐怖主义和暴力极端主义内容不应在网络上散播”,因此2017年六月开始将人工智能应用在辨识视频内容上。
古德罗又指,过去团队仅依赖YouTube用户主动检举不当内容,再由YouTube小组依规定进行审核、移除违反社群规范的内容,或是加上年龄限制等设定。过往的做法实在太慢了,因此在去年六月起,团队导入人工智能技术去识别暴力极端主义相关内容,找出这些内容后,再交由系统进一步判别并审查。截至去年九月,所有因为含有暴力极端主义内容而遭强制下架的所有违规视频中,有超过80%的视频是在用户还没提出任何检举之前,就已经从YouTube上移除掉,相比前一个月,提升了8%。
谷歌表示,这仍是实行至今的初步成果,为了加强这个移除机制的准确度,以及减少误判的情况发生,YouTube小组审核了超过100万部的视频,希望能够通过为系统提供大量的训练实例,让机器学习的应用效益达到优化。
即便如此,开发团队仍然认为机器识别技术和审查机制仍不够完善,还需要持续进步以降低误判,因此开发团队开始让人工智能来“认识”视频中人类的动作,为了提升机器学习认知视频中人类动作的能力,开发团队导入原子可视化动作数据学习模式(Atomic Visual Actions, AVA)。
直到去年11月,AVA已经分析了超过57万组视频片段、生成21万个动作标签,总计标注了9.6万组人类的动作。不过目前AVA仍在研究的初步阶段,谷歌承诺,未来希望有更多的研究投入,能够加速AVA的发展,让YouTube的视频内容生态朝向正向发展。
领取专属 10元无门槛券
私享最新 技术干货