博士论文放出：Automatic assessment of singing voice pronunciation

文章来源：企鹅号 - Music加上Tech

放出博士论文，准备下周二提交。pdf 点击原文

Automatic assessment of singing voice pronunciation: a case study of jingju music

主要贡献：

京剧数据库：

收集了京剧清唱音频和音节、音素标注数据库，分成三个部分，放在了zenodo.org上面。

https://doi.org/10.5281/zenodo.780559

https://doi.org/10.5281/zenodo.842229

https://doi.org/10.5281/zenodo.1244732

京剧演唱音节、音素分割测试数据集（section 4.2.1) https://doi.org/10.5281/zenodo.1185123, https://doi.org/10.5281/zenodo.1341070

京剧演唱错误发音侦测测试数据集（section 4.2.2）

京剧演唱发音相似性测试数据集（section 4.2.3）https://doi.org/10.5281/zenodo.1287251

技术贡献：

分析发音在京剧演唱训练中的重要性（section 3.1）

分析京剧演唱发音自动评价的挑战、机遇和应用（section 3.2）

总结京剧演唱自动发音的4个问题，并且给出state of the art总结（section 3.3, 3.4）

使用收集的数据库做简单的音乐学上的统计分析（section 4.1.2, 4.2）

新的京剧演唱音节、音素分割的方法（Chapter 5）https://github.com/ronggong/interspeech2018_submission01, https://github.com/ronggong/musical-onset-efficient

使用HMM和深度学习鉴别错误发音的方法（Chapter 6）https://github.com/ronggong/mispronunciation-detection

使用acoustic phoneme embedding来表示音素片段和测量音素发音相似性的方法（Chapter 7）https://github.com/ronggong/DLfM2018

自动演唱发音评价在solfège上的应用（Chapter 8）

音乐表演自动评价、onset detection、唱词和音频对齐、acoustic embedding的文献总结（section 2.4）

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货