微软小冰的目的是无处不在,采用了情感基础的框架,做了生成模型,并且实现了全双工语音技术。IT之家曾报道,之前小冰的演唱深度学习模型完成第四次重大升级,并一起发布了新模型生成的最新单曲【我知我新】,这首歌曲在现场也重新以3D方式演示。
《我知我新》首次采用第四次迭代版本的小冰演唱DNN模型。在歌词创作方面,基于LSTM的seq2seq模型,小冰先利用深度神经网络学习超过1000万行的歌词语料,并在此基础上训练,再通过多感官诱发创作灵感,生成歌词。
采用DNN模型的新增优势包含:首次加入换气声自动合成能力,通过歌声与气息的融合,使人工智能生成的歌声更富有感染力;通过在深度学习建模中增加控制的方式,字与字、音符与音符之间的过渡更加连贯顺畅;通过进一步优化的深度神经网络结构,以及大幅度补充的训练数据,使小冰并行学习来自不同人类歌手的演唱风格,并脱离手工参数输入,自行完成演绎等。
领取专属 10元无门槛券
私享最新 技术干货