中南 | 情感分析革命：UniSA 引领多模态情感分析进入新纪元！(含源码！)

ShuYini

发布于 2023-09-14 16:39:58

6630

发布于 2023-09-14 16:39:58

引言

情感分析是自然语言处理中的一项重要任务。它旨在利用多模态信息实现情绪分类进而了解人们的情绪状态。它由多个子任务组成，例如：会话情感识别（ERC）、aspect-based的情感分析（ABSA）和多模态情感分析（MSA）。最初的研究主要关注单个子任务，却忽略了这些子任务之间相互关联的情感知识。然而，要想将情感分析中的这些子任务进行统却存在一定的挑战，例如：统一的输入/输出形式、模态对齐和数据集偏差。

恰好，今天给大家分享的这篇文章就做到了，他们采用生成式Transformer架构将情感分析的所有子任务统一为生成任务，提出了一种新颖的「多模态情感分析框架UniSA」，实验结果表明，UniSA在所有子任务上的表现与最先进的技术相当，并且可以很好地推广到情感分析中的各种子任务。

Paper：https://arxiv.org/pdf/2309.01339v1.pdf

Code：https://github.com/dawn0815/UniSA

背景介绍

情感分析是一门利用多模态数据提取人类评论观点，理解和分类人类情感的学科。从广义上来说，情感分析包含了大量的子任务，如会话中的情感识别(ERC)、aspect-based的情感分析(ABSA)和多模态情感分析(MSA)。最初的研究主要关注单个子任务，却忽略了这些子任务之间相互关联的情感知识。因此，将所有子任务集成到单个模型中以提高模型的情感理解能力已成为一个重要的目标。

在其他领域统一多任务建模的引领下，最近的研究探索了联合建模一些子任务的潜力，例如，有人联合建模ERC和MSA以提高这两个任务的性能；还有人将所有ABSA子任务转换为统一的生成公式，产生了特别好的结果；然而，目前却「没有人将所有情感分析子任务(ERC、MSA、ABSA等)作为单个研究对象进行联合建模」。

情感分析所有子任务的统一建模面临三个主要挑战:

1)「格式挑战」。每个子任务的输入格式和分析视图各不相同。例如，MSA基于单轮对话分析情绪倾向，ERC通过对话中的语境信息综合评估说话人的情绪，ABSA从话语中提取属性词并根据这些属性词判断情绪倾向。联合训练这些具有不同输入和输出格式的子任务是第一个挑战。
2)「对齐挑战」。一些子任务使用多模态数据(例如，ERC)，而其他子任务使用单模态数据(例如，语音情感识别)。不同模态(文本、声音、视觉等)的数据格式和表示方式不同，每种模态都以其独特的方式表达情感信息。例如，文本情态主要使用情感词、定语、情态词和否定词来表达情绪，而声学情态主要使用强度、语速、停顿等声学参数来表达说话人的情绪波动。视觉形态通过面部表情、身体姿势和眼神来表达人类的情感。跨模态实现情感信息对齐是第二个挑战。
3）「偏见挑战」。情感分析是一项高度主观的任务，确保模型学习普遍的人类情感知识，同时较少受到主观偏见的影响是第三个挑战。此外，数据集注释偏差可能会影响具有高质量注释的多模态数据的质量，从而难以训练可以跨不同数据集泛化的模型。