品玩7月27日讯,据微软官方消息,微软推出一款名为NaturalSpeech2 的语音模型,可带来高质量的语音合成产品。
微软表示,NaturalSpeech2 可以生成具有不同身份的人声语音,拥有不同的韵律和风格,还具备唱歌能力。
实验结果表明,NaturalSpeech2 在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在 LibriTTS 和 VCTK 测试集上的自然度(以 CMOS 为度量)与真人语音难以区分。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货