放出博士论文,准备下周二提交。pdf 点击原文
Automatic assessment of singing voice pronunciation: a case study of jingju music
主要贡献:
京剧数据库:
收集了京剧清唱音频和音节、音素标注数据库,分成三个部分,放在了zenodo.org上面。
https://doi.org/10.5281/zenodo.780559
https://doi.org/10.5281/zenodo.842229
https://doi.org/10.5281/zenodo.1244732
京剧演唱音节、音素分割测试数据集(section 4.2.1) https://doi.org/10.5281/zenodo.1185123, https://doi.org/10.5281/zenodo.1341070
京剧演唱错误发音侦测测试数据集(section 4.2.2)
京剧演唱发音相似性测试数据集(section 4.2.3)https://doi.org/10.5281/zenodo.1287251
技术贡献:
分析发音在京剧演唱训练中的重要性(section 3.1)
分析京剧演唱发音自动评价的挑战、机遇和应用(section 3.2)
总结京剧演唱自动发音的4个问题,并且给出state of the art总结(section 3.3, 3.4)
使用收集的数据库做简单的音乐学上的统计分析(section 4.1.2, 4.2)
新的京剧演唱音节、音素分割的方法(Chapter 5)https://github.com/ronggong/interspeech2018_submission01, https://github.com/ronggong/musical-onset-efficient
使用HMM和深度学习鉴别错误发音的方法(Chapter 6)https://github.com/ronggong/mispronunciation-detection
使用acoustic phoneme embedding来表示音素片段和测量音素发音相似性的方法(Chapter 7)https://github.com/ronggong/DLfM2018
自动演唱发音评价在solfège上的应用(Chapter 8)
音乐表演自动评价、onset detection、唱词和音频对齐、acoustic embedding的文献总结(section 2.4)
领取专属 10元无门槛券
私享最新 技术干货