4年前,由微软共同创办人保罗.艾伦设立的艾伦人工智慧研究所举办的一场赛事中,超过700位电脑学者竞相开发能通过美国8年级科学考卷的人工智慧,胜者将能获得8万美元奖金,然而最终无一达成目标。拥有常人所不能的知识量,过目不忘的AI,竟会被区区国、高中等级的考卷给难倒,或许很难让人想像。但事实上证明,当时最先进、複杂的AI系统,连取得60分都有困难。因为不管学识含量再丰富,看不懂题目就一点意义也没有了。不过,最近的AI研究终于攻克阻碍,艾伦人工智慧研究所新推出的AI系统「Aristo」成功跨越了这道门槛。且绝不是低空飞过,AI在美国8年级科学测验中答对9成题目;12年级科学测验中,也有8成的答题正确率。虽然这有一些「前提条件」──碍于目前AI系统的能力,研究人员删除了与图表、图片有关的题目,因为这需要更高一层将语言理解、逻辑与电脑视觉结合的能力。
尽管如此,Aristo依旧深刻展现了人工智慧技术在理解语言脉络、模拟人类决策逻辑上的重大进展。打造「数位版亚里士多德」,科学家让AI写考卷。早从2013年起,艾伦人工智慧研究所便著手开发Aristo,他们希望能打造出一个「数位版的亚里士多德」,研究人员认为,比起传统让AI下棋的作法,给它们写科学考卷更具训练意义。
研究人员指出,对考题的理解并非依靠学习规则就能掌握的,需要AI运用逻辑连结不同事物之间的关联性,就像森林大火增加,就可能造成果实、昆虫的数量锐减,进而导致松鼠死亡。Aristo的基础源自一套由Google建立,名为Bert的自然语言处理模型。在彻底研读维基百科数千篇条目,以及大量浪漫小说、科幻小说与自行出版书籍后,Bert开始学会如何推测句子中阙漏的字词。借由这项训练,Bert学会了语言的基本建构方式,而研究人员则给予Bert更广泛的问题与答案,渐渐地,它也学习到如何解答类似的问题。
虽然Aristo距离学者的终极目标:模拟人类智慧,还有一大段距离,目前展现的研究成果,已经足以开创商业应用上的潜力。研究所负责人奥伦.埃齐奥尼(Oren Etzioni)对此颇具信心,「我能说的是,你将见识新世代产品的诞生,部分源自新创,另一部分则源自大企业。」这些自然语言处理模型,如今已成为许多研究项目的核心,例如用于识别假新闻的工具,以及聊天机器人使用的对话系统。水能载舟,亦能覆舟,也有人担心,有办法熟练运用语言的AI,反倒可能助长假新闻散播。
无论如何,这项技术的潜力太过庞大,没有人敢为其未来做出定论。另一间AI研究室Fast.ai研究人员杰瑞米.霍华德(Jeremy Howard)就表示,目前仍处于技术的早期阶段,还未探索到其真正的潜力,这项技术最终将抵达何方,可能还没有人知道。在美国以外,世界各地也有不少科学家将AI研究的目光,放在做考卷身上。
2017年时,中国也曾进行了一场AI与「学霸」们的高考数学比试,最终AI获得134分,以1分之差惜败精英学生组的成绩平均,但仍向外界揭露AI在做考卷这档事上,已经越来越上手。
领取专属 10元无门槛券
私享最新 技术干货