前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >自适应语音合成实验方案

自适应语音合成实验方案

原创
作者头像
b.ug
发布2022-10-17 20:21:10
4000
发布2022-10-17 20:21:10
举报
文章被收录于专栏:实验

自适应语音合成也可以认为是训练一 个多说话人模型(也就是预训练模型),主要是通过一个256维的讲者嵌入来表征不同说话人,将表征后的讲者嵌入加入到改进后的声学模型中,利用该模型提取训练集内不同说话人的时长、能量、音高等音频信息,进而得到梅尔频谱的音频表征形式,而在最后的声码器部分则选择使用Parallel WaveGAN和MelGAN分别进行实验。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档