IT派 - {技术青年圈}
持续关注互联网、区块链、人工智能领域
自2011年苹果在发布iPhone4s时,同场发布苹果系统级语音助手siri, 语音助手甚至是更深入的语音识别技术,已经在公众视线内陪伴了我们6年的时间。当初苹果向我们展示了siri在未来生活中的无限可能,现在语音助手市场究竟有多大,又活得怎么样呢?
Siri,你好
2010年Siri首次在苹果的iPhone上登场,尽管当时很多人觉得Siri有点华而不实,但是这个语音助手已经在我们的生活中占据了一角。基本上Siri可以承担预约、查找邮件、做笔记等工作。它的出现标志着用户与智能手机的互动能力提高了,并且随着时间的推移,这种互动能力会越来越强。
现在你开车的时候,Siri可以帮你导航,也可以帮你选择在苹果电视上收看的节目,还可以帮你控制卧室的灯。虽然Siri是目前最知名的数字语音助手,但它不是市面上唯一的产品。
我们还有Google助手、三星的Bixby、微软的Cortana以及亚马逊的Alexa。事实上,这些语音助手远比Siri聪明。尽管Siri是第一个出现的,但它没有Google一样强大的搜索信息库。
Stone Temple收集了5000个常识性问题,对个人助手进行了测评,结果如下图所示:
语音助手无处不在
曾经只有智能手机才有的技术,如今已经衍生到了我们口袋里那块玻璃砖头之外。智能音箱的出现,意味着你只需在房间里放台音箱,就可以马上访问数字语音助手了。
根据Quartz的数据,17%的美国消费者已经拥有了自己的智能音箱。当然,这种音箱最初的吸引力不是特别高,且目前的使用也似乎微不足道。但是,Quartz引用了来自Activate Tech和Media Outlook 2018年的报道数据,并指出大多数的用户并没有发挥这种音箱的最大潜力。这其中还包括所谓的“超级用户”。
尽管如此,数字语音助手真正的魅力不仅限于这些智能音箱。迟早有一天,这些助手将渗透到我们所熟悉的各种设备之中,比如耳机、汽车音响等等。届时我们可以对着空气讲话,随时随地获取所需的所有信息。
智能助手不再受限于操作系统
你可能以为Siri仅限于苹果的设备,Alexa只能在亚马逊的平台上使用,而Cortana和Google助手也分别绑定到了Windows手机和安卓系统。现阶段这样的假设基本是正确的,然而,科技的发展速度飞快,说不定一眨眼的功夫这些助手就跳到了别的平台上。
值得一提的例子是亚马逊已经为Alexa制定了雄心勃勃的计划。根据The Verge的报道,亚马逊打算将Alexa装到车辆上,这一计划的目的正是创造随处可用语音助手的设备。The Verge还报道了微软和亚马逊已在该计划上建立了合作关系。据报道,“上个月亚马逊总裁Jeff Bezos联系了微软总裁Satya Nadella,双方已达成合作关系。此次亚马逊和微软的合作旨在更好地集成语音助手Alexa和Cortana。Alexa的用户可以访问Cortana,并通过versa访问一系列的设备。尽管这种集成刚开始时有点别扭,但是可以为数字助手之间跨平台的互相通话奠定基石。”
为了扩大影响范围,赢取更多用户,各大公司纷纷积极推进跨平台的语音助手应用程序。Google助手已经安装到iPhone上了,而安卓和苹果的用户都可以访问Cortana。
会讲话的烤面包机
从钢铁侠中的Jarvis到星际迷航中的计算机系统,人类一直渴望可以和我们直接交流的计算机科技。在过去的十年里,我们见证了手机用户界面的极大提升,但是还未能满足我们想与机器对话的欲望。
Wired杂志曾报道,高德纳咨询公司预测用户与科技30%的交互将通过与智能机器的对话完成。如今,这些可以接收指令的智能机器不仅包括音箱或耳机,还将包括家电。
试想如果烤面包机告诉你面包快吃完了,或者冰箱发短信告诉你该买哪些菜了。甚至,冰箱在你上班期间自动在网上下单。还有更厉害的,比如Siri知道你的血糖高度偏高,因为冰箱告诉她你吃了半块蛋糕。
数字语音助手与“一切”的集成势在必行。事实上,我们正在见证一场各大公司间的竞赛,就看谁先做出来了。
数字助手不是玩具
目前,可能数字助手看似有点多余,不过是个高端的玩具,但事实未必如此。根据TechCruch的报道,苹果正在计划将翻译服务添加到Siri。Google助手已经提供了翻译,虽然只是Google的搜索结果。而且,这些数字助手可以在工作中起到很大的作用。它们可以翻译文字,当某项工作目标已达成或未达成时向工作人员发出警告,以及取代个人助手的角色。
据华尔街日报最近的报道,数字语音助手已经进入了办公室。报道中说,创业公司Process Street的流程管理CEO Vinay Patankar曾提到,“比如,纽约市的Goodwinds公司的工人在办公室的屋顶安装了亚马逊的Echo,可以帮助他们执行将活动添加到日历和设置会议提醒等任务。”但据华尔街日报说,这个产品的问题是它不太适合工作场合,更适合家庭使用。虽说如此,他们也意识到这种情况会在将来有所改变。
隔墙有耳
语音助手的设计旨在方便我们的日常生活,但是否会被人利用监视我们呢?
当用户向数字助手提出问题的时候,隐私的噩梦就已经开始了。用户的问题会留下痕迹,而这些问题的数据会被IT巨头用于开发语音助手。
举例来说,根据the Atlantic的报道,向Siri发出的请求和设备ID会被苹果保存6个月,之后他们会删除设备ID,但是音频文件将再保存18个月。加载了智能数字助手的设备都会有这个缺陷。有人发现Google的Home Mini Speaker会将用户说过的话保存24小时*7天。
亚马逊的智能音箱也有这个问题。这款设备不仅可以通过“Alexa”和其他特定单词触发,并且可以被任何人触发。假设你认识的某个人名叫Alexa,如果你在某些场合提到他们的名字,而恰巧周围有个智能音箱,那么这个音箱就会录下你说过的一切,而你可能丝毫不知情。很明显这个缺陷会被人利用去偷听别人的谈话。
去年亚马逊卷入了一起谋杀事件的调查,因为检察官要求亚马逊提供嫌疑人所持有的Echo智能音箱的信息。据美国有线电视新闻网(CNN)报道,亚马逊拒绝了将Echo记录的信息交给阿肯色州Benton县的起诉律师。在这起案件中,该智能音箱确实是凶手的“目击者”。也许未来你的自由将取决于一个机器人,这种情况是完全有可能发生的。
6年过去,语音助手的未来怎样?
从一开始只是作为增加手机亮点的一个辅助功能,到现在巨头入场,将语音助手更好地和生活场景结合,语音助手的发展完成了从“跑龙套”到配角的转变。以Amazon Echo和Google Home的竞争作为导线,我们可以看到语音助手在未来生活中正逐渐占据着位置,引导消费者以更加方便的模式进行人机交互。
国外势力竞争势头正酣,国内的势头也不可忽视。在Business Insider的报导中,百度也是一股不可忽视的力量。能够被Business Insider赋予如此厚重的期待,相信也是和百度近年在人工智能上的发力有着不可分割的关系。无论是用于智能驾驶的Apollo2.0,还是开放给合作方的DuerOS 2.0,语音输入在里面都占据了相当重要的地位。占据着潜力巨大的中国市场,并且在搜索引擎份额上有着巨大的领先优势,以语音助手作为撬开下一个时代的杠杆,百度这步棋布局设想得相当不错。
另外,在消费者视线中并不算相当耀眼的科大讯飞,也是中国势力中不容忽视的一道力量。和百度以及谷歌相比,讯飞的优势在于语音识别的准确度。即使不谈与其他平台和开发商之间的合作,科大讯飞旗下的讯飞语音输入法,在笔者日常的使用中也能够表现出相当不错的识别效果。这也从侧面证明了在语音助手2.0时代中,要想获得长足的发展,厂商应必须有强悍的竞争强点。
从附庸到配角,再到现在,隐隐有成为次世代人机交互方式的主流,语音助手经历了厚积薄发的过程,更需要有厂商甚至巨头在背后不断推波助澜。随着语音巨头们的善意不断被放出,标榜智能化的下一个时代将会有更多硬件语音助手的结合。消费者将会逐渐感受到语音助手融入生活中,通过说话这一种方式提高消费者的生活工作效率。
程序员小依