源Rankred译翟向洋
在过去的几年中机器学习有着令人惊奇的发展。其中的一些可能导致数以亿人使用的技术的突破。人工智能领域发展迅速,虽然它有很大的前途,但在快速推进这些系统集成到更大的平台方面,我们仍然面临许多挑战。
最近,Jyväskylä大学、AMI中心(芬兰)和Aarhus大学(丹麦)的科学家已经开发出一种通过在你听音乐时监控你的大脑揭示你是否接受过音乐方面的训练的系统。
通过在听音乐时收集到的脑图像数据上应用数字音乐分析和机器学习的方法,研究小组能够(非常准确地)判断听众是否是专业音乐家。
研究
这份研究利用功能性磁共振成像(fMRI)的大脑数据--该小组收集了来自36名音乐家和非音乐家(18人)的在他们正在听多种体裁歌曲的数据。采用不同的计算方法提取播放的音乐的特征。
通过对在一段时间内处理曲调和旋律的大脑建模比依靠人脑活动的静态表象是更好的。这正是研究人员所做的。他们考虑了暂存的动态图像,显著地提高了结果。作为建模的最后一步,他们用机器学习技术来创建一个组合不同的大脑区域准确地估计音乐感的模型。
最准确预测音乐感的区域主要位于大脑右半球的颞叶区和额叶区。他们发现这些与注意力、音乐习惯的处理方式以及音调、音高等声音特征有关。
结果表明,排出了音乐熟悉度和偏好等因素的干扰,对于神经对歌曲的反应音乐训练与否有很大的影响,这在一定程度上可以区分非音乐家的大脑和音乐家的大脑。
机器学习模型
从音乐家和非音乐家听三种不同类型的音乐风格时,我们收集到整个大脑的功能性磁共振成像(fMRI)数据。从声学信号中测量出代表音乐感知方面的高阶(音调和节奏)、低阶(音色)的6个音乐特征。然后基于fMRI数据的时间序列和音乐特征分成非音乐家和音乐家两类。用到大脑的9个区域包括额叶和颞叶皮质区、扣带回皮质区的机器学习模型预测听众的音乐感的准确性为77%。
准确性
从边缘区、听觉和运动区以及值得注意的内侧眶额区、右侧颞上回、前扣带皮层获得其准确性。通过线性回归将不同的音乐特征结合到已编码的三维fMRI图像取得了令人印象深刻的77%的准确率。
当涉及到从依赖于时间序列的血氧水平中解码音乐特征时,对于大多数听众的节奏和音色特征有显著地的精度提升。然而,在听众中对于高阶的关键特征的准确率差异很大,这表明在神经处理中存在内部参与的变异性。
简单地说,这项技术的新颖之处在于将功能性神经成像测量(在听力环境中获得)与计算声学特征提取相结合,并考虑到神经处理的动态性。
这代表了重大的贡献,补充了最新的大脑阅读技术,解码了听者在现实环境中大脑活动的数据。这项研究也加深了我们对大脑如何处理特定的声学特征和语音语调的理解。
-END-
译者 翟向洋
北京理工大学研究生一枚,吃瓜群众,热爱学习。
了解如何加入我们
领取专属 10元无门槛券
私享最新 技术干货