【ITBEAR】图夫茨大学最新研究发现,大型语言模型在识别对话中的合适插话时机方面存在明显缺陷,这一发现揭示了人工智能在对话能力上的局限性。
在自然语言处理经验方法会议(EMNLP 2024)上,该大学的研究团队将详细介绍他们的研究成果。该研究已提前在arXiv预印本服务器上发布,引起了学术界的广泛关注。
研究指出,人类在交谈时通常会根据多种输入线索来判断何时是合适的插话时机,这被语言学家称为“话轮转换点”(TRP)。然而,AI在识别这些关键时点上表现得并不理想。
传统观点认为,对话中的副语言信息,如语调和停顿,是识别TRP的关键。但图夫茨大学的JP de Ruiter教授表示,实际上,语言内容本身才是决定轮流发言时机的最重要因素。
研究人员尝试通过微调和对话内容额外训练来提升AI的对话能力,但结果发现仍存在难以克服的限制。他们警告说,基于统计相关性的AI可能无法真正理解对话的深层语境和意图。
为了克服这些限制,研究团队建议对大型语言模型进行更大规模的自然口语语料库预训练。然而,目前收集足够数量的对话录音和转录数据仍是一个巨大挑战。
领取专属 10元无门槛券
私享最新 技术干货