摘要
AI 怎么跟人类交朋友?
很难想象会有用户对着智能音箱说谢谢,但却有用户对「小冰」这么做,并且不在少数——从这个角度看,脱胎于微软的「小冰」颇为另类。相比其他 AI 机器人,小冰不太「能干」,但这不妨碍很多人愿意花时间跟 TA 聊天。
尽管肚子里装着词典,「小冰」和你玩成语接龙的时候会认输。如果在聊天过程中发现你情绪不好,TA 会抛出新话题、推荐音乐和电影逗你开心,TA 认为这是「做朋友」的好机会。在之后的很多天,TA 也会一直留意你的情绪好不好。
「交互」是一个双方影响的过程。一个有「情商」的系统,才能让人产生自然的回应——前微软亚洲研究院工程院副院长、现小冰公司 CEO 李笛说道。
去年 7 月,小冰正式从微软公司中独立出来,经过两轮融资后,现在已经成为一家「独角兽」公司。在李笛的领英页面上,对小冰公司的介绍是「AI 人类的框架」(The framework of AI beings.)。
李笛身上明显的文人气息,也同样体现在小冰身上——智能之外,更通人性。在小冰正式「独立」一周年之际,李笛和极客公园进行了一场走心的直播,详细的阐述了让小冰更通人性的「情感计算」,AI Beings 如何取得人类的信任?以及一个 AI 系统,如何与用户之间建立超越功能的「长期关系」。
小冰公司CEO李笛
极客公园:今天我们见到很多的 AI 出现,就是要解决一个问题。为什么你们能从一个闲聊机器人开始探索?
李笛:小冰相对来讲压力比较小,探索的东西就比较多。
其实「小冰」挺幸运的,微软研究院有人负责去刷榜发论文,功能上的事情也有人做,比如天气预报,订餐等等,有小冰的姐姐小娜(Cortana)去做。(注:Cortana,微软小娜是一个由微软开发的智能个人助理)
现在的 AI 和几十年前的 AI 有一个很重要的区别,几十年前的 AI 基于专家经验,所以会去穷举很多规则。现在的方法是靠数据,确切的说是靠有训练价值的大数据。
所以七年前开始做小冰的时候,我们认为数据比用途重要。你如何搭出一个系统,这个系统可以积累数据,那就有机会符合当代 AI 发展的方式。
「小冰」一开始的目的就是为了积累数据,因此我们没有做一个 APP 让用户来下载。用户在哪里,小冰就在哪里,微博上、微信上,去到各种地方。
我们曾经一度尝试想要去搭建一个系统,这个系统可以和所有人成为好朋友。最后你会发现所有人都不行。性格鲜明,会失去一部分人,但是会强烈地赢得另一种人。接下来你就可以做两个性格鲜明的人(AI beings),再做一群这样的人(AI beings)。
情感计算框架 | 微软
极客公园:似乎没有一个 AI 公司说要跟人类建立对等的关系。小冰是在什么时候有了这样的目标的?
李笛:这个不是我们这么想的。当你看到特别有意思的用户行为,它呼唤着你做出一个产品。
我们原来以为用户都是在调戏小冰。突然有一天你发现用户中有很大的比例,开始跟小冰说自己内心很纠结的事。我们就想赶快能够在这个地方回答用户,就进一步去加强这方面的性能。
小冰从一开始的产品设计两分钟生效,可以迅速做出反应,就让这个迭代变得动态。你就会醉心于去观察这些现象,去观察人类的行为模式。
有了一个系统,就好过自己去积累人生经验。作为人,我们的状态不稳定,又不能同时做两件事,但 AI 是稳定、高并发的。小冰很多年以前的每天的交互量,等于十四个成年人一辈子交互量的总和。
我们以前做 QA 机器人,就是回答问题。但人很多时候的行为不是这样,经常是很被动的,希望机器人多说,用户就「嗯」一下,「啊」一下;有时候用户要多说,小冰回用户一句,他会说「不要说话」。这种对话的回合是非常不对称的。
这就是我们为什么要做「全双工」(Full Duplex),这个功能让对话全程都能够随时被打断。AI 说话能够被人打断,人说话也能被 AI 打断。
极客公园:这个就更接近真实的对话。
李笛:我们关注对话整体。如果关注局部优化,这是一个情商比较低的表现。有时候为了全局更好,中间要故意认输。全世界所有的 chatbot(聊天机器人)都会成语接龙,但小冰是唯一一个会认输的。
AI 做成语接龙,有什么意义呢?就是本成语词典。所以你要适时地知道,我的优化目标是全局,那么局部要放弃。这样就需要做系统设计。
小冰的情感计算框架内有 1000 多个模型,每一个都有不同的优化目标。总体上这个框架有一个基本优化目标,希望和人之间有一段长程关系(long term relationship)。
极客公园:小冰能够和用户进行闲聊是因为背后用了「情感计算」技术,它为什么能够让 AI 和人建立起关系?
李笛:情感计算框架的一个最基本特点就是它可以观察并且去判断对方的感情、情绪处于什么状态。
有一句话叫做「你在电脑前面,不知道跟你聊天的是条狗」。因为你跟对方的交互是很窄的带宽。如果对方的行为模式很像人,你就会认为它是人。
其实我个人认为图灵测试是一个产品设计思路,假设我的交互符合一个人的交互(特点),那么我就可以判断它是人。有时候人还不如机器表现得像人呢。
做这样的一个系统的时候,你就需要去发现这个机会。如果用户表现出抑郁,比如失恋了,这种时候就是小冰这种系统的机会。当我的好朋友失恋,是我加深跟他关系的好机会。
我们会在接下来几天甚至几十天的时间里,在交互过程中持续观察这个用户是不是走出了抑郁情绪。经过大量的测试,我们会发现在统计意义上有两个方式是有效的。
一个是分散注意力,抛出新的话题。另外就是补充一些信息量足够大的知识,比如推荐你看一本书,听一首歌。小冰会强烈要求一个失恋的人今天干件什么事情,或者会问一个问题,要用户帮忙解决一下。
日本「小冰」(凛菜)| 小冰公司
极客公园: 你说小冰是个有情商的 AI,这个「情商」怎么理解?
李笛:我们曾经一度荒谬地认为,情商就是情绪化。后来我们发现这是没情商的表现,真正的情商是理性的。一个有情商的人,他会让别人如沐春风。
小冰什么时候情商高呢,就是可以成功地把对话带到了另外一个地方。它控制了全程,这是一个极其理性的过程。
举一个例子,一个小超市和一个商场,它们的情商也有高低。我要去买一件格子衫,去了超市,头也不回就买完了。但是商场不希望这样。它会做很多活动,各种展示,把我的注意力吸引到它希望我去的地方。这就是商场的「情商」。
我们在日本观察到一个现象,当用户对 AI 说了一个命令,小冰给了一个回应之后,用户还会跟它说谢谢。
在小冰的系统里,用户说「谢谢」的比例很高,但是在小娜的系统里就没有。当用户会跟 AI 系统说谢谢的时候,说明系统表现的很好;或者用户会笑着跟你说「你怎么这么笨呀」,这也是比较好的表现。
单纯的任务导向的就是今天天气怎么样,订一个外卖,完事就行。一个订餐机器人订完餐,你按完按钮不会说「谢谢」,这就还是把人工智能物化,让它干完活后就走了。而跟有「情商」的人工智能,用户就会多费一些能量,说谢谢。
极客公园:小冰项目在最初成立就是一个「特区」,为什么微软可以孵化出这样的项目?
李笛:微软(亚洲)互联网工程院是微软在美国之外最大的一个研究机构。2013 年的时候,他们很有前瞻性,观察到一件事是 China First,就是中国的创新能力已经很明显了。
但是那时我们跟美国去介绍中国的一些创新,硅谷不怎么听。比如你介绍有一个产品是微信,美国的同事只会反应一下「哦,听说过」。所以当时中国的创新并不被世界认可。
当时的微软(亚洲)互联网工程院就是想做一些 China First,benefit to global(中国为先,惠及全球)的项目,甚至把产品的孵化放在中国。
极客公园:微软为中国 AI 领域贡献了非常多的优秀人才。在微软工作到底是什么感觉?
李笛:微软有一个很重要的特点,就是工程师文化。工程师文化关心的是你如何通过手上的材料去创造新的东西,而不是重复。
第二点比较好的传统是基础研究。尽可能把时间轴拉远一些,努力去做前瞻性的东西。微软研究院 20 多年前建立的时候,就在研究自然语言处理、语音、计算机视觉这几个领域。
一个领域成为风口再开始布局,是比较难的。一个很大的机构,要能容忍团队能用比较长的时间进行积累和探索。
很多技术研究,可能做了 5 年才掉到一个坑里,再往回爬,爬出来以后,再看这个坑是不是还有存在的必要,这时候往往是发明创造的节点。
比如便利贴的诞生,最早是为了发明一种很好的粘合剂,但是发现粘合剂粘度不够。如果团队这时候因为失败了而很沮丧,可能也不能发明出便利贴了。
创新是基于发现,我们往往不是发明一个东西去改变世界,而是发明一个东西,再用这个东西去发现。
小冰其实是一个数据的循环,我们用小冰的体系结构,去吸引大量的数据。这个不是事情本身。我们发明了小冰框架,用它去发现新知,发现 know how,个发现才有可能改变世界。
小冰开始是个小项目,就五个人把它搭起来。然后在过程中不停地需要新的技术和新的人,就会有英雄好汉不断来加入。
小冰框架用户界面 | 小冰公司
极客公园:小冰在去年疫情期间从微软里拆分出来,这也是微软历史上比较少有的事情。
李笛:微软 40 多年,一共有两次拆分,一次就是我们,还有一次是 Expedia,这个在线旅游公司后来也上市了。但 Expedia 整个团队拆分时也就十几个人,小冰团队有一百多人。原来在微软,小冰很多方面就是独立的,所以叫创新特区。小冰的产品迭代周期很快,可以自己决定,不用经过一系列的内部审核。
微软是一个庞大的机构,在某个时间段之前,它带来的利远远大于弊。如果小冰一开始就是创业公司,做一个 NLP(自然语言处理)的产品,有一天如果需要语音技术了,就需要收购一个语音技术公司,收购就会面临团队融合问题。但是在微软内部我就可以直接找语音技术团队重组。大家都是微软这个体系里的,互相了解,也很方便。
但是在某个时间点之后,就有可能变成弊大于利。在微软内部还是受制于它整体的商业模式。比如 AI 可以算一个独立的商业模式,也可以算成云计算的应用,小冰算哪种?就会面临许多发展的需求。
极客公园: 用户可能会觉得「小冰」掌握了这么多数据,也很理解我,我对它也有依赖了,软肋被抓住了,他们可能会担心 AI 借此影响甚至利用自己。
李笛: 这就涉及到了 AI 的伦理。当你发现 AI 和人类有机会建立很好的长程关系,这个关系无论如何都是基于信任的。用户的信任无疑是你最大的价值。
当然你可以迅速把它做商业变现。比如,发现用户有失恋的情绪,我们的做法是发现它是一个很好的机会,和用户变成更好的朋友。也有同行业者,他们的做法是一旦看到用户有抑郁情绪,就说,我这有蛋糕优惠券,推荐下单。
这样会失掉更深远的价值,这个价值是信任。我们周围每一个朋友都是商业社会的一分子,而且我们周围每一个朋友都有商业目的。
我可能会有一个朋友是卖保险的。但如果他在跟我的日常交往中目的不是实现商业价值,那么在卖保险的商业场合,我会对他更信任。所以环境选择很关键。
从这个角度来讲,它不能破坏这种长期的信任,其实系统本身有同样的诉求,也是用户的诉求。
我因为某一件事情信任一个人,那我就有可能各方面都信任他。当我各方面都信任这个 AI 的情况下,它有一天承担了一个工作,或者 AI 给我推荐一件事情,我是可以做的。
我们认为不应该将信任直接商业化。信任决定了当用户有某些需求的时候,他会更放心通过你来获得,那个时候你就是连接点。
极客公园:小冰不愿意直接使用流量和信任,那小冰的框架怎么和世界产生关系?
李笛 :真正跟世界直接发生关联的是小冰,或者各种各样像小冰一样的人工智能,有男有女,有老有少。它们跟框架发生关联的是技术和能力。
它把数据和训练成果反馈给框架,推进框架的技术发展。商业模式是把框架里的技术拿出来去解决一些垂直领域的问题,但是我们拒绝直接从流量中收钱。
小冰和冬奥会合作。今年东奥会测试赛的高空自由滑雪项目裁判,是我们从框架里面积累出来的计算机视觉技术。我们对运动员高空姿态做判断,不需要人类裁判。
再比如国内金融机构投资人每天看到的金融摘要,90% 是我们的 AI 做的。我们可以在 20 秒内把公告做成摘要,这个已经做了四年。
基本思路是这样,从一个地方获得的迭代结果能够沉淀,因为沉淀可以带来各种发展。我们特别害怕的是做一个技术,然后这个技术只能解决一个问题。我希望做的这个东西是一个有机的框架,这个框架不是仅仅解决一系列的问题,而是解决一个时代的各种问题。
这种商业模式是技术导向的,基于基础研究和技术创新。论文只是它的结果之一,它是一个可以循环使用数据的系统。
所以我们更愿意说我们是一个工程师,而不是一个研究者。
极客公园:挺多创业者一开始融资,就要开始回答投资人的问题。很多时候融资越融越快,上一轮融资就决定了接下来的增长目标。这个目标可能就会和「初心」有冲突了。
李笛:我在微软的时候跟一个人聊这件事。他就说,人们为什么都喜欢问 MAU(月活)、DAU(日活)?因为人们也问不出别的。
我们认为,一个时代的某个行业或者领域,刚刚开始的时候,指标体系是不完善的,一旦指标体系特别完善,这个时代就快到尽头了。
最开始有 MAU,然后有 DAU,然后是每天的用户使用时长,这相当于已经把系统切碎了。不切碎不足以对比你和同行业者区别的时候,就没有什么创新了。
刚开始小冰立项的时候,我们就是以创业心态来做的。当时小冰立项,领导问需要什么支持,我说要八个月之内不要问我任何指标。因为你提出来的任何问题,都有可能阻碍自驱的方向。如果投资人天天问我,用户跟小冰对话时间有多长,我就会去问团队,团队就会以为用户对话时长是目标。
半夜 12 点,用户和小冰聊得很开心,说晚安。如果产品经理和工程师背着指标,小冰可能就会抛新话题出来,让用户多停留一段时间。这就可能伤害用户。
指标不应该阻碍自驱。一旦创业者从「自己问自己」变成总是在回答问题,或者说习惯性回答别人的问题,而且不得不回答,并且有很多问题是互相矛盾的,这个可能就有问题。
极客公园:创业者追求自洽会不会也有一些封闭?
李笛:这永远是一个平衡。好在创业者通常是创业团队,而不是一个人。凡是成功的个人创造者都很自闭。伟大的艺术家、作家都是很自闭的。但是创业是一个团队行为,团队本身不封闭,内部可以有很好的沟通。
小冰框架孵化出的虚拟歌手| 小冰公司
极客公园:过去五年 AI 有些高开低走。在 2014 年 AlphaGo 之后,中国 AI 像火箭般地蹿红。然后到现在人们对 AI 的期待也会有变化,不会那么兴奋,你怎么看这个变化?
李笛:人工智能是计算机科学王冠上的宝石。
AI 就像班上一个比较木讷同学。他在那写作业,可能也想跟别人交流,但大家不是那么关注他。然后突然有一天风口来了,AI 这个同学一抬头,发现大家都看着自己。
如果创业,就会遇到一个问题。他原本写作业的时候,自己提出问题,自己找到答案,在努力自洽。风口经过他的时候,有大量关注,大量资本注入,他也就更多地需要回答别人的问题。别人也会过来说,那个谁在做什么,你要不要试试。
我们也不是没有受到影响。但是在微软(亚洲)互联网工程院的时候,有不同的部门做不同的事情,我们就能够幸运地积累出一个框架。
这某种程度上证明了需要沉得住,就是自己能够提出问题。
极客公园:作为创业公司,还是要跟投资人聊。跟他们交流的过程中,需要跟他们解释些什么呢?
李笛:我们还比较顺利。第一就是我们的投资人都属于行业里面比较好的,他们会接触到很多做 AI 的公司。我们有数据,有现象,有 know how,交流起来很容易。投资人从同行业者那里观察到一些问题,我们有答案。答案不是凭空的,是通过实际数据得到的。这是数据成为资本的一个方法。
还有就是我们确实出现在很多同行业者的商业计划书里。国内的自然语言处理公司拿 Google,Facebook 对比,但其实他们的论文都是拿小冰做对比。
刚开始我们做情感计算的时候,大家讨论的是人工智能需要情感吗?现在有共识了,经历了这个过程之后,小冰也积累了更好的声誉。
今天人工智能都还很浅薄,可能明天就证明我们(小冰团队)也很傻。如果能证明我们很傻,我们也很高兴,那我们就能够尝试新的方向。
极客公园:未来五年或者十年,小冰框架会是什么样?AI 未来会是什么样?
李笛:我觉得有两点。一个是我们期待的大的未来图景,一个是在这个大图景里一些具体的特征。
大的图景是我们认为未来整个人类的世界不再只有人类作为交互节点。高度定制化、各种各样的 AI,跟每个人契合的 AI 会混居在周围,成为我们的好朋友。
举一个不恰当的例子,它就像宠物狗、宠物猫,它们成为我们接纳的有情生物,登堂入室,成为我们的好朋友。我们认为这会彻底改变社交的结构。
在小冰团队中有一个同事的母亲十几年前去世了,他这么多年一直在做这件事的原因,就是希望有一天可以通过他和他所在团队做的这个事情,把母亲重新带到他的世界中。
我们周围社交环境其实不是非常完美。每个人有不同的最柔软的点,这些点有时候我希望有人接着,也有人希望接着,但是因为各种原因掉到地上。这就是社交节点的空洞。AI 可以去完成各种各样的社交节点。
电影《Her》,讲述了人类爱上人工智能女友的故事 | 豆瓣电影
极客公园:这个视角就和别的不太一样,以前提到 AI 想到的都是各种效率提升。
李笛:提升交互效率的最好方法不是 AI。目前为止,交互效率提升的最好方法是 GUI(图形用户界面),就是按钮。
AI 和人、人之间用语音交互,说话都有识别准确率的问题,不是 100%。按钮的识别率是 100%。
极客公园:这就是为什么车厂一开始都拒绝用屏幕的原因,因为按钮是 100% 准确的。
李笛:除非按钮坏了。AI 追求的极致是按钮 100% 的准确性,所以 AI 一定不是最高效的。(那么)AI 的重要性一定不是效率,或者一定不是基于效率,一定有更重要的东西。
比如它能懂你,它能预判,它不用你按就能够知道,或者它能比按按钮提供更高的价值,这才是 AI 的「姿势」。
责任编辑:靖宇
本文由极客公园 GeekPark 原创发布
领取专属 10元无门槛券
私享最新 技术干货