驱动中国2018年3月29日消息 据外媒报道,谷歌公司近期正推出一款新的AI语音合成器,用于其机器学习云工具套件。这款语音合成器是一项名为云文本到语音的服务(Cloud Text-to-Speech) ,并由谷歌位于英国的AI子公司DeepMind通过WaveNet提供技术支持。
据悉,此次谷歌推出的AI语音合成器,在WaveNet的支持下借助机器学习从头开始生成音频,通过分析人类语音数据库中的波形,并以每秒24,000个样本的速率重新创建这些波形,包括唇音和口音等微妙的声音。
相较而言,目前包括苹果Siri的大多数语音合成器使用了所谓的连接合成技术,即通过其中程序存储单个音节 - 诸如“ba”,“sht”和“oo”的声音 - 并且将它们一起飞起来形成单词和句子。这种几年前在成熟应用的技术,在现在听起来仍然很尴尬。
在谷歌于2014年收购DeepMind之后,这家公司就在探索将AI技术变为有形产品。借助DeepMind AI技术,谷歌数据中心的电力成本降低40%,并将WaveNet直接整合到其云服务中。谷歌表示,DeepMind的AI语音合成技术是业内最先进和最现实的技术之一。
在去年10月份,WaveNet就被整合到Google Assistant中。现在基于Cloud Text-To-Speech,可用于语言的精选。谷歌称,这项新服务提供32种不同的语音,可以说12种语言,用户可以自定义音调和速度等因素
领取专属 10元无门槛券
私享最新 技术干货