2018年,IBM研究院在美国旧金山展示首个能与人类进行复杂辩论的AI系统Project Debater,右侧是以色列国际辩论协会主席Dan Zafrir.(来源:IBM)
钛媒体3月18日消息,IBM研究院杰出工程师、Project Debater首席调研专家、人工智能专家Noam Slonim和团队发表了最新研究成果:一个名为Project Debater(意为“辩手项目”)的自主系统,已可以与人类专家选手进行体面且有意义的现场竞赛辩论。该系统能通过扫描储存了4亿篇新闻报道和维基百科页面的档案库,自行组织开场白和反驳论点。虽然该研究中人类辩手被判定最终获胜,但作者认为,评分接近人类专业辩手水平,人工智能(AI)技术或具备参与复杂人类活动的能力。
据悉,本研究成果于今晨登上了顶级学术科学期刊《Nature》(自然)杂志封面。
本周《自然》杂志封面图
本论文通讯作者、IBM研究院杰出工程师Noam Slonim博士在接受钛媒体App采访时表示,作为有史以来首个人工智能系统,Project Debater可以与人类进行有意义的现场辩论,这一研究成果具有重大意义。同时,这也是IBM研究院掌握语言这一更广泛议程上的一个重要里程碑。
钛媒体了解到,本份研究中的IBM Project Debater是首次登上《自然》主刊封面。
事实上,AI发展到今天,应用层主要是计算机视觉(CV)以及听觉环境中。虽然可能存在像GPT-3这种文章变换语言新技术,但未有其大规模商用化应用案例。如今随着技术的发展,数据集的不断延伸,具有创造力的AI辩论场景成为了新的可能。
IBM的Project Debater项目由来已久。
1997年,IBM研发的超级计算机深蓝(Deep Blue)国际象棋比赛中击败了世界冠军加里·卡斯帕罗夫(Gary Kasparov),而象棋一直被认为是一种人类社会的高智力博弈。
Project Debater项目最早于2011年被提出,研究目标是让AI与人类进行现场辩论时应对自如。2018年,IBM Project Debater首次公开亮相,并与以色列国家辩论冠军Noa Ovadia和以色列国际辩论协会主席Dan Zafrir进行辩论。最终在“是否应该增加使用远程医疗”的其中一个议题中,Project Debater赢得了辩论,但在另一个“我们是否应该资助太空探索”话题中败给了人类。最终以各获一次胜利的结果展示给世人。
如今的这篇最新论文,更多是描述Project Debater项目中的体系结构并评估了其性能,还有使用AI赋能于辩论环境的技术过程。
具体来说,研究人员利用大量人工标记的高质量数据,通过训练深度神经网络 (DNN)和弱监督DNN来提高自然语言处理 (NLP)技术框架,从而取得和人一样的辩论能力,并通过文本转语音方式输出到外界当中。
论文中称,Project Debater辩论过程主要由以下四个模块组成:论点挖掘、论据知识库(Argument knowledge base)、论点反驳和论证构建。
那么,AI辩手真的有能力和人进行主题辩论吗?
论文中提到,研究人员向人类组成的虚拟观众提供了辩论的文字稿,让他们在一系列话题(如资助学前教育)上对该系统与人类(包括专业辩手)和现有AI技术的辩论表现进行盲打分。尽管Project Debater在组织开场白方面的得分很高,明显优于其他系统,但最后并没能赢得辩论。
最终,Project Debater在78类辩题中获得接近人类专业辩手的平均评分。
Project Debater得分情况(来源:论文)
作者认为,赢得辩论比赛并非IBM Project Debater项目的研发重点,仅仅预示着一个新技术的开始。未来,这种AI辩手将有潜力在全球范围内协助人类制定日常的复杂决策。
“我们的辩论绝不是输赢,我们想证明AI系统和功能如何理解、生成自然语言,我相信我们做到了这一点,并且在此过程中学到了很多东西。”Noam Slonim对钛媒体App强调,AI辩手的作用,主要还是能够帮助人们推理,模拟人类困境,建立充分的论据,提供数据驱动的辩论内容的生成和表达能力,做出更好的决定。
在《自然》杂志附评论文章中,来自英国邓迪大学(University of Dundee)辩论技术中心的Chris Reed撰文认为,该研究开发了一个完全自主的计算机系统,能够与人类现场辩论。这一发现暗示,未来AI技术可以帮助人类制定并理解复杂的论点。
针对于该技术系统的难点和局限性等问题,Noam Slonim表示,Project Debater的数据语料依然较少,情感层面还无法与人类比拟。
他认为,有些问题人类本能理解支持某一主题,但对于AI来说,直接理解十分困难,大都依靠数据语料。如果Project Debater没有学习任何主题,其只能创建有说服力的描述,并非直接产生论点、论据等。他希望未来该系统可以覆盖更庞大的语料库,从而更好解决十分困难的辩论议题。
IBM方面透露,目前Project Debater项目已经实现了部分商业化,潜在应用包括金融顾问、律师、公共事务决策、学生助手和企业决策者等。在上周举行的格莱美颁奖典礼上,该AI辩手就流行文化话题展开了非打分式辩论。
Noam Slonim强调,Project Debater解决了一个重大的挑战,代表了AI技术的进步,而且拓宽(超出)了当前AI技术的舒适区,未来将能够参与更加复杂的人类活动。
(本文首发钛媒体App,作者|林志佳,编辑|盖虹达)
领取专属 10元无门槛券
私享最新 技术干货