“对于记录来讲,每一份记录都有两类人:一个是记录的产生者、记录者,另一个是记录的观察者。”
记录者是生产视频的人。快手 CEO 宿华认为,每一个人都有着相同的渴望,那就是希望自己的状态、自己的情感、自己的灵感能够被更多的人看见,并且被更多的人理解。而观察者则是看视频的人,他们可以通过视频软件看到更广泛的世界,比如在城市的人能够看到农村,而农村的人可以看到世界。
正是这两种人的交织与互动,促使视频在产生以及分享过程中为他们自己带来满足感。但随之而来的便是挑战——视频公司若想要捕获这些情感,就必须越过天文数字级别的坎。
然而快手的日活超过了 1 亿,每天产生的视频数量超过一千万,不用想也知道,光靠人工的力量是不可能实现的。于是快手给出了这样一个时髦的答案,那就是 AI。
快手平台负责人韦彬表示,快手的 AI 在应对海量数据处理的背后,依靠的是快手强大的系统平台工程团队。
首先,支撑海量社区交互的分布式在线服务需要处理每秒千万级的实时数据的传输和计算,同时还需要做到高可用、解决社区服务特有的热点问题;其次是支撑巨量数据的存储服务,则需要支撑每日 P 级的数据增长,同时提供高性能高可靠的查询能力,为此来自AI研发团队做了很多深度优化。
同时,为了加快 AI 研究,快手自主搭建了基于 GPU 集群的 AI 引擎,可以快速调研,测试和发布先进的AI算法和模型。
快手一直非常重视 AI 团队的建设,快手 AI 研发团队多来自斯坦福、卡内基梅隆等高校,以及 Google、微软等知名科技企业,同时也在积极招揽人才。他们相信 AI 研发团队实力会始终保持在业内领先的位置。
快手 AI 技术副总裁郑文曾经举过这样一个例子:快手会通过深度学习算法来检测用户拍摄的场景类别,并据此选择最适合的滤镜效果来提升视频的质量。通过人体关键点识别技术,快手能够为用户的肢体加上特效,比如让虚拟的火球跟随人手的位置进行运动,此外还有很多人脸装饰贴纸、AR 模型等基于 AI 技术的特效,让每个用户的记录形式更加丰富多彩。
算法与幸福感之间的联系
正如宿华所说,幸福感的提升实际上是来自两类人。对于观察者来说,内容分发的质量高低,才是决定他们获得幸福感的关键。事实上,AI 推荐算法从很久以前就被卷入了一个舆论漩涡之中。这是指人们的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”中的现象。
由于信息技术提供了更自我的思想空间和任何领域的巨量知识,一些人还可能进一步逃避社会中的种种矛盾,成为与世隔绝的孤立者。在社群内的交流更加高效的同时,社群之间的沟通并不见得一定会比信息匮乏的时代来得顺畅和有效。
郑文对 DT 君表示,快手的 AI 一定程度上已经做到了避免信息茧房。他表示,AI 主要进行了海量的视频理解和海量的用户理解,然后把内容和用户进行精准匹配。这个匹配的机理不仅仅是只根据单个用户的喜好需求和内容来进行连接,还会基于某一个内容点来研究大量的用户具有哪些共性,找出这种共性,再来用它拓展单个用户的兴趣边界。简单来说,就是 AI 让成千上万的用户和你一起来探索。这种方式自然能有效防止信息茧房,还能加强人与人之间的联系。
郑文还举出了这样一个例子,“某一位用户对足球感兴趣,那么后台 AI 系统除了给他推送足球和其他球类甚至其他类别体育运动相关内容,还会对同样喜欢足球的群体进行分析,找到他们除了足球以外还有哪些兴趣点,从而把这些兴趣点相关内容也推送给这位用户,帮助用户不断拓展兴趣边界,打破信息茧房,也与其他人建立更强更深入的连接。”
换句话说,快手的 AI 其实是发力在产生者以及观察者两端的。郑文对 DT 君说:“之所以讲快手帮助用户提升幸福感,是基于记录和连接。因为千千万万的记录和分享,所以用户得以看见彼此发布的内容,看见记录这些内容背后的彼此,用户用这种方式和这个世界发生连接。这种有效的连接,一定程度上可以帮助用户消解孤独,让用户自身的视野、审美、学习的欲望、知识结构、对世界的了解、乃至把握外部机会的可能,都会发生一些积极的有利的改变,这种改变是会提升每个人独特的幸福感的。要实现这种海量的连接,那么就一定需要技术来提供对视频的理解,对用户的理解。”
Y-Lab 浮出水面
郑文还向 DT 君介绍了快手 Y-Lab。这其实是一个成立于 2016 年 9 月的实验室,致力于通过最前沿的科技带给用户新奇的记录体验,研究领域涉及人工智能、机器学习、计算机视觉和计算机图形学等。
其较为知名的成果是通过快手的视频拍摄功能,让用户的脸以猩猩脸的样子展现在屏幕上。据说这样做是为了配合电影《猩球崛起 3》的宣发。
“Y-Lab 对于未来的技术发展有自己的判断,并且已经做出了一些布局。”郑文告诉 DT 君,“其中,我们非常希望能够为人类在人工智能领域的整体发展贡献出自己的力量。为此,我们在人工智能相关的一些基础方向上都有一定的投入。”
郑文还介绍了几个 Y-Lab 正在研发的“黑科技”:比如目前流行的深度学习方法需要大量的数据标注,耗时长代价大。但其实人类并不需要大量的标注来进行学习,而是先从对世界的观察中自主学习到一个基本模型,再在这个基础上通过少量标注,举一反三的学习。这正是目前 Y-Lab 的研究目标之一。
郑文进一步指出,目前的人工智能也无法像人类一样具备常识,所有的任务都必须从最原始的数据开始进行训练。解决这些基础性的问题,将可以把人工智能向更接近人类智能的水平提高一大步,不仅仅对于快手有很重要的意义,对于全人类来说也是激动人心的进步。
如此看来,快手对于 Y-Lab 的重视程度很有可能和谷歌对待 DeepMind 是一样的。郑文表示快手是一家科技驱动的公司,人工智能技术是快手技术的核心,也是公司发展最重视的方向。
用科技的力量带来独特的幸福感
无论是宿华或者是郑文,他们都是资深的计算机研究者。“幸福感”这个饱含感性色彩的词对于理工男来说,或许比开发、写代码更难理解。然而快手的确做到了,用户与视频的高速增长就是最好的证据。
宿华曾经表达了他这样一个愿望,“也许有一天我们做的人工智能系统,能够像我一样,像人类一样去理解生活中的片断,能够更好的理解人类的情绪、情感,甚至是灵感。我很期待那一天的到来。”
他说这是在看一个包含人类复杂情绪的视频时所感悟到的,“一对男女拥抱之后,发出带有悲伤情绪的声音,但分开的时候又很决绝。”
或许有一天机器真的能理解人类,这也是为什么快手着手于研究多模态信息融合的视频理解。郑文表示,这项技术将使机器更好地理解视频中图像、文字、语音、音乐等多重维度的信息,实现机器对视频更高层级的理解,在内容推荐、分发上有更清晰的参考依据。
这些技术的研发,均为服务快手的本质——社区。宿华以自己为例展示社区对兴趣拓展的重要性,“一方面是随机的,比如为什么我会做人工智能,因为某天碰到了一个在做机器学习应用的团队,我跟他们聊了以后很感兴趣,从此走上了这个路,这是一个非常随机的状态。还有一个做法是问朋友,比如有人在你的朋友圈里面,或者你的室友、你的同学,分享他昨天打了棒球,很好玩,问你要不要一起来玩一下,或者刚学了一个 C++ 语言不错,要不要一起来学,从而帮助你扩展你的兴趣偏好。”
在一个大的社区里面,总有兴趣相似却不同的一群人。在尝试帮助用户扩展兴趣的时候,去理解一个用户群偏好的时候,快手会把这个逻辑应用其中,“你不是一个人在探索,社区里面有成千上万的人跟你相似又不同的人在一同探索,同时,你也在帮助其他跟你相似而不同的人去探索。”宿华说到。
同时,宿华也揭示了快手的愿景:构建一整套的以 AI 技术为核心的基础设施,用科技的力量提升每一个人独特的幸福感,让每一个人更多更好的感受这个世界,也能够更好的被这个世界所感受到。
-End-
领取专属 10元无门槛券
私享最新 技术干货