语音音箱的出现,是人机交流方式大变革的开端。语音技术使机器获得类似于人类耳朵、嘴巴的感官功能,这彻底改变了人和机器人的关系,也为未来的数字世界创造了巨大价值。
1
什么是语音交互?
语音交互(VUI)指的是人类与设备通过自然语音传递信息、交流的过程。完整的语音交互要经过ASRNLPSkillTTS四个流程,如下图所示。
ASR是将声学语音进行分析,并得到对应的文字或拼音信息。
NLP是将用户的指令转换为结构化的、机器可以理解的语言。一般进行Domain(领域)Intent(意图)Slot(词槽)三级拆分,以“帮我定个明天早上7点的闹钟”为例,“闹钟”是领域,“定个闹钟”是意图,词槽是“明天7点”,这样机器人就知道执行什么指令了。
Skill就是处理NLP界定的用户意图,做出符合用户预期的反馈。
TTS即语音合成,从文本转换成语音,让机器说话。
2
应用场景,环绕“衣食住行”
通过语音交互能解放我们的手眼处理其他事情,让人在多感官协作的场合可以“一心两用”,方便我们操作。随着AI语音技术从算法到模型的进步,语音技术应用逐渐进入工业、车载、家电、客服、通信、医疗、家庭服务、教育等领域中,从企业到个人用户,AI语音的场景越来越多的落地,普及开来。
1)家居场景:
家庭环境比较封闭、私密、噪音少,是理想的语音交互环境。人们通过不同的指令,操作电视、音箱、灯、空调、油烟机等家庭电器,免去繁复的操作,使用更方便。
2)车载场景:
车载语音的运用,可以帮助驾驶员减少对车内设备的直接操作,如导航、广播、接打电话、开启空调、雨刷等,专注于路况,提高行驶安全系数。
3)医疗场景:
语音技术运用于病历录入,节省医生书写时间,提高工作效率,方便随时查阅。
4)客服场景:
AI正在改变企业的客服服务方式,由智能客服解答80%的用户常问问题,人工专注解决剩下的复杂的问题。效率提高,成本降低,让服务更有温度,为用户提供更好的个性化服务。
还有各类智能音箱、手机助手、法务机器人、其他服务机器人等。规划行程前:“Siri,明天什么天气”,开车时:“开启上班路线导航”,在家里时对音箱说:“播放周杰伦的歌”。语音交互技术已经逐渐融入我们的生活,为大家带来便利。
3
万亿元大市场
2019年全球语音交互市场规模13亿美元,根据美国投资机构MangroveCapitalPartners发布的《2019年语音技术报告》预测,2025年语音经济规模将达到1万亿美元,超过移动应用经济。融资上,语音技术创业公司融资金额屡创新高,从2017年的2.89亿美元、2018年的5.81亿美元,到今年的的7.86亿美元,市场前景看好。
企业服务部分,以中国市场为例:全国500万全职客服,按年平均工资6万元,算上辅助的软硬件设施,其他方面投入,整体规模约4000亿人民币,若替换比例达40-50%,排除硬件投入、预算缩减部分,智能客服公司能得到200-300亿规模的市场份额。
4
语音交互的未来
目前语音技术虽说已经能够让机器人听懂大部分人话,但距离超级智能助理的交互能力还早,但随着技术的发展和场景应用的加深,行业已经进入了产业爆发期,整个行业正从初期快速过渡到成熟期。
技术上,免唤醒词交互、针对离线语音识别和多通道交互是未来发展的方向,随着家庭智能设备越来越多,新的用户需求也不断涌现,各大语音技术厂商不断摩拳擦掌,加紧了对市场的争夺。
在客服领域,不仅是客服人员的人力释放,向营销、销售等重要的企业服务的外部场景延伸。AI推动交互方式的变革,物联网、智能设备的普及,这些设备也将成为企业服务客户的新入口。
未来,智能音箱或者与之类似的连接不同设备的语音交互产品,将会成为每个家庭的标配,像智能手机一样普及。不同产品连接到了一起,将推动家庭IOT生态建立,能否满足个性化的增值服务是关键。
Yeta机器人
让沟通更高效
你「在看」吗?
领取专属 10元无门槛券
私享最新 技术干货