社区首页 >专栏 >百度发布全深度学习文本到语音转化系统 Deep Voice，比 WaveNet 快400倍

百度发布全深度学习文本到语音转化系统 Deep Voice，比 WaveNet 快400倍

新智元

发布于 2018-03-27 07:20:10

1K0

文章被收录于专栏：新智元新智元

【新智元导读】 百度最新发布文本到语音转化系统Deep Voice。百度称，这是一个全部由深度神经网络构建的系统，在文本到语音的转化速度上比 WaveNet 快400倍。

百度研究院今天发布 Deep Voice，这是一个文本到语音转化系统，完全由深度神经网络构建。

百度研究院在官方博客上写道：

目前，要搭建这样一个系统，最大的阻碍在于声频合成的速度，此前的方法一般都需要数分钟或数小时来生成几秒的语音。

我们解决了这一难题，并且证明我们能够进行实时的音频合成。在速度上，这一系统比WaveNet 参数部署要快400倍。

从文本中生成人造的语音，通常被称为文本转语音（TTS），它是许多应用，比如，语音驱动的设备、导航系统和视力障碍者设备中不可或缺的工具。从根本上说，它能让人在不需要视觉交互的情况下与技术进行互动。

现代的 TTS 系统都是基于复杂的、多步骤的处理管道，其中，每一个管道都可能会依赖于人为设计的特征和启发。由于这种复杂性，建造新的TTS 系统是非常消耗人力，而且也会非常困难的。

DeepVoice 受到传统的本文到语音的管道启发，并且采纳了相同的架构，但是，DeepVoice 使用神经网络来代替全部组件，并使用了更简单的特征。这是的我们的系统能更好地适用于新的数据库、声音和领域，而不需要任何人为的数据标注或者额外的特征设计。

DeepVoice 为真正的端到端的，且不需要复杂处理管道、不依赖于手动设计特征进行输入和预训练的语音合成奠定了基础。

我们目前的管道依然不是端到端的，它由一个音素模型和一个音频合成组件构成。

声音中的机器人声音特性产生于管道结构和音素模型，然后，声频生成组件单独可以生成更加自然的音频片段。

音频片段试听地址： http://research.baidu.com/deep-voice-production-quality-text-speech-system-constructed-entirely-deep-neural-networks/

深度学习以及变革了许多领域，包括计算机视觉和语音识别，并且，我们相信，文本到语音的转换现在也处在了类似的转折点上，我们非常期待深度学习社区能一起努力，并且希望能以一种可再生的细节程度，来分享我们的整个文本到语音的转化系统，进而加速这一进程。

论文：DeepVoice：Real-Time Neural Text-to-Speech

论文作者：Sercan O. Arik ，Mike Chrzanowski，Adam Coates，Gregory Diamos，Andrew Gibiansky，Yongguo Kang，Xian Li ，John Miller ，Jonathan Raiman ，Shubho Sengupta ，Mohammad Shoeybi

摘要

我们在本文中提出一个完全由深度神经网络组成的文本到语音的系统——Deep Voice，它为真正端到端神经网络语音合成奠定了基础。

该系统由5个主要的组件构成：一个用于定位音素边界的分割模型、一个字素到音素（grapheme-tophoneme）转换模型、一个音素音长预测模型和一个基础的频次预测模型以及一个音频合成模型。

在分割模型中，我们提出了一个新的方法来执行音素边界探测，其中的技术包括使用使用深度神经网络和联结主义临时分类（CTC）损失。

在语音合成模型中，我们采用了一个Wavenet 的变体，相比原始版本，我们要求的参数更少，训练速度更快。

通过在每一个组件中使用神经网络，我们的系统比传统的文本到语音系统更加简洁也更加灵活。传统的系统总共，每一个组件都要求人为设计的特征和深度的专业知识。

最终，研究证明，用我们的系统来进行推理，在CPU 和GPU 上，它比实时的和优化后的WaveNet 推理核（Inference kernels）更快，最终比既有的部署快了400倍。

五个组件在系统中的作用示意图

论文下载地址：https://arxiv.org/pdf/1702.07825.pdf

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-03-01，如有侵权请联系 cloudcommunity@tencent.com 删除

深度学习

神经网络

本文分享自新智元微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

深度学习

神经网络

登录后参与评论

暂无评论

【精选】算法设计与分析（第一章概述知识点）

队列集合设计算法容器

命运之光

2024/03/20

1940

C++ STL 标准模板库(容器总结)算法

容器 java 数据结构编程算法

C++ 标准模板库STL,是一个使用模板技术实现的通用程序库,该库由容器container,算法algorithm,迭代器iterator,容器和算法之间通过迭代器进行无缝连接,其中所包含的数据结构都是目前最优解,该库既能保证软件代码的高可复用性,又能保证代码具有相当高的执行效率,STL库是ANSI/ISO的C++标准的具体实现,任何标准库的实现都是以源码形式释出的.

王瑞MVP

2022/12/28

2.3K0

❤ 挑战C站最强C++ STL标准库总结（内含大量示例）

容器 jquery java c++编程算法

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，(ﾉ´▽｀)ﾉ♪-》点击这里->一个宝藏级人工智能教程网站。

全栈程序员站长

2022/09/09

1.4K0

C++ stl_stl函数

容器 java 数据结构 api 编程算法

长久以来，软件界一直希望建立一种可重复利用的东西，以及一种得以制造出”可重复运用的东西”的方法，从函数(functions)，类别(classes),函数库(function libraries),类别库(class libraries)、各种组件，从模块化设计，到面向对象(object oriented )，为的就是复用性的提升。

全栈程序员站长

2022/09/27

2.5K0

【C++】STL的基本用法

存储 stl 遍历 c++容器

vector 是 C++ 标准库提供的一个动态数组容器，它可以自动扩展和收缩，使其非常适合存储和管理可变数量的元素。

SarPro

2024/02/20

1960

C++ 序列式容器总结

容器 java c++编程算法数据结构

C++ STL 是一套功能强大的 C++ 模板类，提供了通用的模板类和函数，这些模板类和函数可以实现多种流行和常用的算法，关于 STL 呢，下面通过一个系统框图来对其进行一个总结：

wenzid

2021/09/08

1K0

【c++】标准模板库STL入门简介与常见用法

其他

STL（Standard Template Library）标准模板库，主要由容器、迭代器、算法、函数对象、内存分配器和适配器六大部分组成。STL已是标准C++的一部分，使用STL开发系统可以提高开发效率。

马三小伙儿

2018/09/12

7520

C++ STL (标准模板库) 详细内容讲解

容器 java jquery 编程算法 c++

顺序容器有以下三种：可变长动态数组 vector、双端队列 deque、双向链表 list。

杨鹏伟

2020/09/11

2.1K0

【C++】STL标准模板库容器set

c++容器 set stl 函数

multiset的接口是和set一模一样的,区别在于具体的使用上:

修修修也

2024/09/28

1100

【C++】—— vector使用

递归数据 c++容器 vector

STL库里面构造函数参数有空间适配器（allocator），这里先不了解这一方面的内容（后面再详细学习）。

星辰与你

2024/10/17

1890

【C++篇】解密 STL 动态之魂：全面掌握 C++ vector 的高效与优雅

c++容器 stl vector 程序

C++ 标准模板库（STL）是现代 C++ 编程的基石，其中的容器、算法和迭代器为开发者提供了高效、灵活的数据处理工具。vector 作为 STL 中最常用的顺序容器，不仅支持动态数组的功能，还通过自动内存管理和丰富的操作接口，极大简化了数据操作的复杂性。无论是在日常开发还是算法竞赛中，vector 的高效性和灵活性都使其成为开发者的首选。

半截诗

2024/10/09

4630

【C++篇】解密 STL 动态之魂：全面掌握 C++ vector 的高效与优雅

C++ STL学习之【list的使用】

c++list stl 对象数据

STL 中的 vector 存在头部及中部操作效率低的缺陷，需要另一种容器来弥补其短板，此时 list 就应运而生，list 是一个双向带头循环链表，是链表的终极形态，除了不支持下标的随机访问外，其他方面效率都是极高的，本文将带大家认识、使用 list 容器

北海

2023/07/01

2450

C++ STL 详解

list map set string vector

以前一直在用C语言，很多数据结构都是自己造的，比如链表、队列等，但是搞竞赛还是C++ 有优势，感觉好多题都是针对C++ 出题的所以打算学学C++，所以现在先整理一下STL中一些最常用的容器的使用方法和迭代器备用。

Fivecc

2022/11/21

1.2K0

【深入探索 C++ STL 双端队列 deque】 —— 数据时空的双端虫洞，扭曲常规操作的效率边界

队列数据效率 c++stl

deque又叫双端队列（Double ended queue），头文件为<deque>，deque是 C++ 标准模板库（STL）中的一个容器类，它允许在两端进行高效的插入和删除操作。

换一颗红豆

2024/12/20

3070

【深入探索 C++ STL 双端队列 deque】 —— 数据时空的双端虫洞，扭曲常规操作的效率边界

【C++】你对vector的了解又有多少呢？

遍历数组 c++cout vector

六点半就起.

2024/10/16

600

【C++】STL--vector

c++cout stl vector 程序

使用STL的三个境界：能用，明理，能扩展，那么下面学习vector，我们也是按照这个方法去学习

用户11375356

2024/11/22

850

【C++】探索STL中的高效容器：vector

c++容器 stl vector 数据

C++标准模板库（Standard Template Library，简称STL）是C++的一个库，提供了一组通用的模板类和函数，实现了常用的数据结构和算法。C++中的vector就是是标准模板库（STL）提供的一种容器。

大耳朵土土垚

2024/05/24

1660

容器对象基础数据类型指针

STL 标准模板库 Standard Template Library 主要包括容器 / 迭代器 / 算法三大类内容 , 其中容器和算法是通过迭代器进行关联的 ;

韩曙亮

2023/11/10

1.2K0

【C++】STL 标准模板库 ② ( STL 标准模板库组成 | STL 十三个头文件 | STL 六大组件 | STL 容器存放基础数据类型 | STL 容器存放类对象 | 容器存放对象指针 )

C++标准库：使用STL提供的数据结构和算法

第三期热点征文-漫谈C++

C++标准模板库（Standard Template Library，STL）是C++标准库中的一个重要组成部分。STL提供了丰富的数据结构和算法，帮助更高效地进行编程。介绍STL中一些常用的数据结构和算法，并给出相应的示例代码。

大盘鸡拌面

2023/12/01

7850

C++提高编程笔记合集

int iterator set string vector

建立一个通用函数，其函数返回值类型和形参类型可以不具体制定，用一个虚拟的类型来代表。

CtrlX

2022/10/27

9470

百度发布全深度学习文本到语音转化系统 Deep Voice，比 WaveNet 快400倍

百度发布全深度学习文本到语音转化系统 Deep Voice，比 WaveNet 快400倍

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐