来源:21Tech(News-21)
作者:倪雨晴
编辑:李清宇、刘雪莹
近日,智能音箱窃听风云登上头条,一边是人工智能规模化落地,另一边是隐私安全问题待解。
不过,今天我们不探讨窃听问题,而是看看备受争议的背后,以语音助手为代表的AI应用会走向何处。
过去的两年中,你会发现,各式各样的APP、品类繁多的硬件产品中,语音助手已经成为他们的标配。Siri、小欧、小艺 、小爱、小度、小娜……正试图成为你身边的partner。
虽然当下智能化程度有限,但是语音将会成为接下来关键的搜索入口、流量入口。
因为在智能交互行为中,除了看之外,听和说绝对是另一种重要的方式。而语音入口级的改变,可以把人进一步解放出来,解放你的双手、还有脖颈,最核心的就是提升效率。
而这样入口级的语音助手不会有很多个,那么,谁会是最终的操控者?
三大派练兵
先来看看桌面上的玩家都有谁。
目前,语音助手大致可分为三个派系。
第一派是手机的语音助手,或者叫智能入口、个人智能助理、人工智能伴侣。在我看来,助手一词并不够准确,因为语音未来不只是助手的概念,更多的是伴侣。单纯中文意义中的助手,功能有限,并且不会帮你做决定。
这里的竞争者可不少。典型的代表就是苹果的Siri,之后,三星Bixby、华为小艺、vivo的jovi、OPPO小欧、小米的小爱同学、荣耀YOYO都已上线。
华为小艺
所有手机都有一个语音模块,不过当前它们的交互层面水平不够高,但是这个语音助手是系统级的功能,所以手机可以自带,第一步是用户量要先上来,才能有更多数据。
第二派是应用中的语音助手,这其中又可以细分为两类。
一类是单个应用的语音助手,比如内置在淘宝、优酷中的语音功能,但很难说它智能化,因为APP并没有外部数据,只是进行内部搜索,不能跨应用,这也就是封闭的私域流量。由于只能在自己的应用里面使用,那面对的语言意向的复杂度就低很多了。因为自然语言处理的难度就在于要对各种人类意向进行拆解分析,找出商业价值的部分。
另一类就是跨平台的语音助手。谷歌有比较大的野心,想让Google Assistant 打通所有硬件设备,并且谷歌在疯狂推广。谷歌的思路还是想做成一个生态,想把谷歌地图、YouTube等应用都集成进去。虽然谷歌是一个操作系统公司,但是它做的C端应用也非常多,并且多是大型的、通用型的、行业型的应用。
比如可以把地图集成进语音助手中解决出行问题,把邮件整合进去可以做商务。比较类似的还有亚马逊Alexa。
Google Assistant
第三派就是各类IoT厂家推出的智能产品。比如音箱产品,天猫精灵、小爱同学、小度音箱,近期荣耀智慧屏也属于此列,还有家电公司在电视等产品中加入语音助手。现在我们能够线上操控的硬件不多,操控的应用软件很多。不过,硬件的控制也在APP化,可以用手机中的应用控制开关、部分电器。
未来,以一个智能硬件为中心,对家电语音控制也有可能。
预测,只是预测
那么,到底谁会赢?笔者来做几个猜测,最终可能还是要等待技术奇点的出现。
手机公司其实难度最大。
因为手机上的应用公司不会愿意对手机进行开放,比如说淘宝电商、亚马逊电商,不会开放接口给手机语音助手。而一些头部应用,它自身的平台体量本身就超过硬件平台。
因此我偏向于微信应用这一派。
有一个说法是,当你发现桌上所有的对手都现身的时候,最后自己还是失败,因为你不是被桌面上的对手打败,而是被边上看戏的打败。
未来,有可能微信会收割所有应用,因为你不得不对微信开放所有接口。各个设备都可以在微信上开发小程序,比如音箱、手机语音助手、甚至电视,每一个都可以是小程序。那怎么调用呢?可以通过微信APP中的语音助手调用这些小程序,你就可以在上面进行呼叫,因为微信是永远待机的。又或者,在所有的硬件上面都安装微信,运行一个微信平台。
比如,我们家里有10个设备,但是硬件们不属于同一家公司,底层系统未必那么理想,小爱音箱是小米的、智慧屏是华为的、手机是vivo的,怎么进行控制呢?当你在屋里说,帮我播放一首歌,音箱、手机、电视都可以帮你播,如果通过微信这个主入口,那它可能会说:电视先帮你放,手机要不要也放?
这是其中一种吃法。因为微信的小程序已经打通了全场景,它累积的操作记录数据也最多。
但问题是,大公司很多也不愿意给微信开放,比如淘宝的商业数据,小米生态链也想自己玩。只是,有的时候是不得不,微信的聊天场景,语音等方面的数据是更成熟的。
以上是应用一派的想象空间,目前,大家还在练兵阶段,不论淘宝、美团、58同城,都有语音助手。其实点餐,手动的步骤很简单,没有语音也不影响使用,但公司要积累数据,训练技术团队,尤其是要有足够的海量训练数据。
另一派潜在收割者就是硬件派,他们有可能会是手机外的另一个入口,也许是现有的音箱,也有可能是手环、手表等等。因为如果语音助手强大到,让屏幕不再那么重要,那手环等也可以进行控制。
所以终极社会中,到底是谁控制谁?多年后很有可能出现技术奇点,尤其是随着5G商用,接入更多设备后,入口争夺战会更激烈。
商业价值的想象
语音入口的流量可能很快会超过搜索,特别是超过PC端的搜索。未来语音入口到底是怎么样的形态,具体如何商业化还不清晰。
但是其中的商业价值很大,因为所说即所得。
比如你对手机说,打开某一部电视剧。那么要在什么应用里打开?是不是需要下载一个APP再打开?没有充值要不要帮你推荐最优惠的方式?还是优先推荐充值过的APP?
这样的广告推荐,和今日头条代表的自动推荐(push)方式就很不一样,语音助手是一个强get(解析信息),并且加上push的一个入口。它甚至是没有广告位的,在交流中,在不经意间向你灌输信息。再比如,电视剧播放后,可能直接播报推荐,电视剧主演的演唱会要不要去?
但现在的问题是,语音集合人工智能,今后能否强大到可以对所有数据进行解构?接下去谁能够成功解决,三大门派谁会赢还不知道。
最后,看一下8月8日,华为发布全球产业展望GIV@2025中的一个趋势:零搜索,这就需要基于语音人工智能。
趋势中说道:“受益于人工智能及物联网技术,智能世界将简化搜索行为和搜索按钮,带给人类更为便捷的生活体验:从过去的你找信息,到信息主动找到你;未来,不需要通过点击按钮来表达你的需求,桌椅、家电、汽车将与你对话。GIV 预测:2025年,智能个人终端助理将覆盖90%的人口。”
你,期待未来解放双手的语音智能世界吗?
领取专属 10元无门槛券
私享最新 技术干货