提到语音助手,已经不会有人再感到陌生了。许多人把语音助手当作贴身助理,要用手机直接动动嘴,而还有不少人把语音助手当成调侃对象,没事就“调戏”一下,比如Siri。
Siri在发布之后好像更多的价值体都现在“被调戏”上,主要原因就在于刚开始的Siri确实太蠢萌了,不仅难以明白你的意图,还时常答非所问。不过经过几年升级,现在总算有了点助手样。
不可否认的是,当前形态的语音助手确实不够好,但它依然是人工智能在咱们生活中最成熟和广泛的应用方式。大家不妨把它当成一个住在各种智能设备里的幼体程序,当它长大之时,就是我们拥有“贾维斯”之时。
那么语音助手是如何被实现的呢?
它们被唤醒、听明白、会说话的过程,背后依靠的是机器学习和数据挖掘算法,以及语音识别、语义理解、语音合成技术等支持。
现阶段,当你向Alexa询问天气状况,它会用愉快的音调告诉你天气晴朗;让它给你讲个笑话时,它会用标志性的断奏给你讲个双关笑话;叫它唱首歌,它就会哼出简单的旋律。
不得不说,Alexa这类的虚拟助手或许拥有着各种像人类一样机灵的功能,但它的语音合成的声音还是出卖了它——Alexa只是个机器人。
所谓机器人口音,简而言之,可以把机器说话理解为对人类的一种模仿。但人们说话并没有固定的模式,就拿地图的语音包来说,明星语音比起默认语音的用户体验自然要受欢迎得多。
一个人在高兴和沮丧时的语气,白天和晚上的音调,工作时和私密时的用词等,都会有明显的不同,而如果用数据库来合成的语音,就很难避免不自然、不像人的地方。
这或许让许多人感到不舒服,有时候我们更加希望与我们对话的听起来像是个人类而非机器人。于是,如何摆脱语音助手的“机器味”就成了重中之重。
当然,想要消除语音助手的“机器味”,或者说至少避免一些严重的违和感,那么背后的语音数据库就一定要构建得更完善、更优质。
升级了它的语音合成系统,让其能编造出更加自然的语音模式,做出各种口头活动,比如低声说话、停顿,调整语音的速度、音量、语气强调和音高。这样一来语音助手可能在不久之后就会听上去不那么像是机器人,而更像是人类。
若是以后能将更好的语音合成技术应用于智能设备中,那么语音助手将彻底改变我们的生活,毕竟能动嘴的坚决不动手本就是人类的天性。
如今的世界,智能化生活逐渐成为主要生存方式,我们不妨好好期待一下各大科技公司带来的未来语音系统,究竟谁家更好用,谁还停留在“银行客服”的水平呢,咱们就拭目以待吧。
领取专属 10元无门槛券
私享最新 技术干货