导航中的林志玲语音，真的是一条条录出来的吗？

文章来源：企鹅号 - KnowingAI知智

如果不是录出来的，

听起来很自然的导航语音，又是如何完成的？

点击下方视频，你对人工智能的了解就能轻松超过全世界 99% 的人类！

图文版本送给不方便打开的朋友 (°u°)」

语音导航我们都用过，

不过温柔的林志玲姐姐语音，究竟是录好的？还是合成的？

在开始合成语音之前，需要先录制一些语音作为语音库。为了尽可能的覆盖语言中的元音、辅音、音调，录制的内容通常需要一定的设计。

合成语音的第一步，是预测文本的读音。除了将文本转换音素序列，为了让生成的声音更加自然，我们还要分析文本的节奏、重音，处理文本中的数字、缩写等等。

接下来，合成声音。一种方法是从语音库中逐一寻找与目标一致的音素，并将它们拼接起来；另一种方法则是将第一步预测的音素转换成每时每刻的语音参数，加上从语音库中学习到的特征，再生成语音。

除了这两种方法，人们还在尝试使用深度学习端到端的完成语音合成任务。不过从结果上看，还是将前两种方法融合起来效果比较好。

在语音导航中，左转、减速、掉头等较短的语句，通常是录好的内容。

关键信息总是在变换的长句子，当然是合成的啦！

「知智一分钟」是由「KnowingAI知智」推出的，以人工智能基础知识为主的短视频栏目。

每次一分钟，轻松了解 AI 领域基础概念！

「知智一分钟」现已入驻 B 站，

欢迎投硬币投香蕉发弹幕吐槽我们！

相关快讯