本文提出了一种 Robust 的多模态模型来提高模型对非对齐模态序列随机缺失的鲁棒性。
CMU-MOSI: CMU-MOSI数据集是MSA研究中流行的基准数据集。该数据集是YouTube独白的集合,演讲者在其中表达他们对电影等主题的看法。MOSI共有93个视频,跨越89个远距离扬声器,包含2198个主观话语视频片段。这些话语被手动注释为[-3,3]之间的连续意见评分,其中-3/+3表示强烈的消极/积极情绪; CMU-MOSEI: CMU-MOSEI数据集是对MOSI的改进,具有更多的话语数量,样本,扬声器和主题的更大多样性。该数据集包含23453个带注释的视频片段(话语),来自5000个视频,1000个不同的扬声器和250个不同的主题 SIMS/SIMSV2: CH-SIMS数据集[35]是一个中文多模态情感分析数据集,为每种模态提供了详细的标注。该数据集包括2281个精选视频片段,这些片段来自各种电影、电视剧和综艺节目,每个样本都被赋予了情感分数,范围从-1(极度负面)到1(极度正面);
AVEC2019: AVEC2019 DDS数据集是从患者临床访谈的视听记录中获得的。访谈由虚拟代理进行,以排除人为干扰。与上述两个数据集不同的是,AVEC2019中的每种模态都提供了几种不同的特征。例如,声学模态包括MFCC、eGeMaps以及由VGG和DenseNet提取的深度特征。在之前的研究中,发现MFCC和AU姿势分别是声学和视觉模态中两个最具鉴别力的特征。因此,为了简单和高效的目的,我们只使用MFCC和AU姿势特征来检测抑郁症。数据集用区间[0,24]内的PHQ-8评分进行注释,PHQ-8评分越大,抑郁倾向越严重。该基准数据集中有163个训练样本、56个验证样本和56个测试样本。
在情感计算任务中,可以看到加入 SimAM 算法后性能有了明显提升,证明了其有效性;
在下载附件并准备好数据集并调试代码后,进行下面的步骤,附件已经调通并修改,可直接正常运行;
<span style="background-color:#f8f8f8"><span style="color:#333333">pip install MMSA</span></span>
<span style="background-color:#f8f8f8"><span style="color:#333333">from MMSA import MMSA_run</span></span>
<span style="background-color:#f8f8f8"><span style="color:#333333"><span style="color:#aa5500"># run LMF on MOSI with default hyper parameters</span>
MMSA_run(<span style="color:#aa1111">'tfr_net'</span>, <span style="color:#aa1111">'mosi'</span>, <span style="color:#0000ff">seeds</span><span style="color:#981a1a">=</span>[1111, <span style="color:#116644">1112</span>, <span style="color:#116644">1113</span>], <span style="color:#0000ff">is_tune</span><span style="color:#981a1a">=</span>False, <span style="color:#0000ff">gpu_ids</span><span style="color:#981a1a">=</span>[0], <span style="color:#0000ff">config_file</span><span style="color:#981a1a">=</span><span style="color:#aa1111">"../config/config_regression.json"</span>,
<span style="color:#0000ff">model_save_dir</span><span style="color:#981a1a">=</span><span style="color:#aa1111">"../saved_models"</span>, <span style="color:#0000ff">res_save_dir</span><span style="color:#981a1a">=</span><span style="color:#aa1111">"../saved_results"</span>)</span></span>
训练过程
最终结果
希望对你有帮助!加油!
若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!