让语音助手摆脱“机器味”，还要做出哪些努力？

文章来源：企鹅号 - 互联网观察

提到语音助手，已经不会有人再感到陌生了。许多人把语音助手当作贴身助理，要用手机直接动动嘴，而还有不少人把语音助手当成调侃对象，没事就“调戏”一下，比如Siri。

Siri在发布之后好像更多的价值体都现在“被调戏”上，主要原因就在于刚开始的Siri确实太蠢萌了，不仅难以明白你的意图，还时常答非所问。不过经过几年升级，现在总算有了点助手样。

不可否认的是，当前形态的语音助手确实不够好，但它依然是人工智能在咱们生活中最成熟和广泛的应用方式。大家不妨把它当成一个住在各种智能设备里的幼体程序，当它长大之时，就是我们拥有“贾维斯”之时。

那么语音助手是如何被实现的呢？

它们被唤醒、听明白、会说话的过程，背后依靠的是机器学习和数据挖掘算法，以及语音识别、语义理解、语音合成技术等支持。

现阶段，当你向Alexa询问天气状况，它会用愉快的音调告诉你天气晴朗；让它给你讲个笑话时，它会用标志性的断奏给你讲个双关笑话；叫它唱首歌，它就会哼出简单的旋律。

不得不说，Alexa这类的虚拟助手或许拥有着各种像人类一样机灵的功能，但它的语音合成的声音还是出卖了它——Alexa只是个机器人。

所谓机器人口音，简而言之，可以把机器说话理解为对人类的一种模仿。但人们说话并没有固定的模式，就拿地图的语音包来说，明星语音比起默认语音的用户体验自然要受欢迎得多。

一个人在高兴和沮丧时的语气，白天和晚上的音调，工作时和私密时的用词等，都会有明显的不同，而如果用数据库来合成的语音，就很难避免不自然、不像人的地方。

这或许让许多人感到不舒服，有时候我们更加希望与我们对话的听起来像是个人类而非机器人。于是，如何摆脱语音助手的“机器味”就成了重中之重。

当然，想要消除语音助手的“机器味”，或者说至少避免一些严重的违和感，那么背后的语音数据库就一定要构建得更完善、更优质。

升级了它的语音合成系统，让其能编造出更加自然的语音模式，做出各种口头活动，比如低声说话、停顿，调整语音的速度、音量、语气强调和音高。这样一来语音助手可能在不久之后就会听上去不那么像是机器人，而更像是人类。

若是以后能将更好的语音合成技术应用于智能设备中，那么语音助手将彻底改变我们的生活，毕竟能动嘴的坚决不动手本就是人类的天性。

如今的世界，智能化生活逐渐成为主要生存方式，我们不妨好好期待一下各大科技公司带来的未来语音系统，究竟谁家更好用，谁还停留在“银行客服”的水平呢，咱们就拭目以待吧。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货