情感分析的应用
近年来社交媒体的空前发展以及配备高质量摄像头的智能手机的出现,我们见证了多模态数据的爆炸性增长,如电影、短视频等。在真实的生活中,多模态数据通常由三个渠道组成:视觉(图像)、听觉(语音)和转录文本。他们中的许多人经常表达某种情绪,这是一种长期的倾向,当一个人遇到一个特定的话题,他们会生成不同的反应和情绪。从多模态数据中挖掘和理解这些情感元素,即多模态情感分析(MSA),已经成为热门的研究主题,这是因为有许多吸引人的应用,例如从客户获得整体产品反馈或从潜在投票者中衡量投票意向的报告。一般而言,同一数据段中的不同模态通常彼此互补,从而为语义和情感歧义消除提供额外的线索的报告。MSA的关键部分是多模态融合,旨在从所有输入模态中提取和集成信息,以理解所见数据背后的情感。
此外,抑郁症对世界各地的个人和社会都有严重的负面影响。目前,抑郁症的诊断主要依靠问卷调查,辅以医学专业评估。但问卷调查的准确性在很大程度上取决于参与者的合作和操作人员的专业知识。近年来,基于人工智能的自动抑郁检测技术越来越突出。这些基于人工智能的抑郁检测技术通常涉及使用各种类型的生理或行为数据,例如面部表情,语音记录,文本和脑电图,通常在参与者的访谈期间记录。在这些数据形式中,音频和文本都很容易访问,并且包含有关抑郁症状的丰富信息。
我致力于对情感计算领域的经典模型进行分析、解读和总结,此外,由于现如今大多数的情感计算数据集都是基于英文语言开发的,我们计划在之后的整个系列文章中将中文数据集(SIMS, SIMSv2)应用在模型中,以开发适用于国人的情感计算分析模型,并应用在情感疾病(如抑郁症、自闭症)检测任务,为医学心理学等领域提供帮助,此外还加入了幽默检测数据集,在未来,我也计划加入更多小众数据集,以便检测更隐匿的情感,如嫉妒、嘲讽等,使得AI可以更好的服务于社会。
这篇文章,我将介绍第二篇情感计算经典论文模型,他是EMNLP 2021的一篇经典MSA论文中的模型–Improving Multimodal Fusion with Hierarchical Mutual Information Maximization for Multimodal Sentiment Analysis(MMIM) 此外,原创部分为加入了抑郁症数据集以实现抑郁症检测任务,以及SIMS数据集和SIMV2数据集。
Improving Multimodal Fusion with Hierarchical Mutual Information Maximization for Multimodal Sentiment Analysis
最近几年,多模态情感分析(MSA)和抑郁症检测(DD)引起了越来越多的关注。在多模态情感分析(MSA)中,模型的性能在很大程度上取决于合成嵌入的质量。这些嵌入是从称为多模态融合的上游过程中生成的,该过程旨在提取并联合收割机输入的单峰原始数据,以产生更丰富的多模态表示。以往的研究要么反向传播任务丢失,要么通过调整特征空间的几何属性来获得较好的融合结果,而忽略了从输入到融合结果的关键任务相关信息的保存。本文提出了一个多模态信息最大化框架MMIM,该框架通过分层最大化单模态输入对(模态间)之间以及多模态融合结果与单模态输入之间的互信息,从而在多模态融合中保持与任务相关的信息。该框架与主任务(MSA)联合训练,以提高下游MSA任务的性能。为了解决难以解决的MI界问题,进一步建立了一套计算简单的参数和非参数方法来逼近它们的真值。
提出了一种用于多模态情感分析层次化MI最大化框架。MI最大化发生在输入级和融合级,以减少有价值的任务相关信息的损失。据我们所知,这是第一次尝试在MI和MSA之间建立桥梁; 作者制定了我们的框架中的计算细节,以解决棘手的问题。该公式包括参数学习和非参数GMM稳定和光滑的参数估计; 在两个公开的数据集上进行全面的实验,并获得上级或与最先进的模型相当的结果。
因为作者发现模型打算拉伸两个向量以最大化中的得分,而不进行这种归一化。然后,与Oord等人所做的相同,将此评分函数纳入噪声对比估计框架,将同一批次中该模态的所有其他表示处理为负样本;
以下是对这种提法的合理性的简短解释。对比预测编码(CPC)“在时间范围内”对上下文和未来元素之间的MI进行评分,以保持跨越许多时间步长的“慢功能”部分。类似地,在MMIM的模型中,要求融合结果Z反向预测“跨模态”的表示,以便可以将更多的模态不变信息传递给Z。此外,通过将预测与每一种模态对齐,使模型能够确定它应该从每一种模态接收多少信息。
在准备好数据集并调试代码后,进行下面的步骤,附件已经调通并修改,可直接正常运行;
<span style="background-color:#f8f8f8"><span style="color:#333333">pip install MMSA</span></span>
<span style="background-color:#f8f8f8"><span style="color:#333333"><span style="color:#0000ff">$ python</span> <span style="color:#0000cc">-m</span> MMSA <span style="color:#0000cc">-d</span> mosi/dosei/avec <span style="color:#0000cc">-m</span> mmim <span style="color:#0000cc">-s</span> <span style="color:#116644">1111</span> <span style="color:#0000cc">-s</span> <span style="color:#116644">1112</span></span></span>
总结
希望对你有帮助!加油!
若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!