【新智元导读】今天下午 HackerNews 爆出消息:AAAI Fellow、AI 先驱 Roger Schank 称 Watson 不是认知计算系统,对 IBM 认知计算的营销提出挑战。新智元第一时间跟进,Schank何出此言?IBM 真的误导了我们吗?!
2016年5月23日下午,HackerNews 网站爆出消息:AAAI Fellow、美国认知科学会创始人 Roge Schank 认为 Watson 不是认知计算系统,IBM 有夸大吹嘘嫌疑。
霎时间激起讨论无数。
Roge Schank 是上世纪七八十年代人工智能和认知心理学先驱,他提出了 Conceptual Dependency Theory 和动态记忆 Case-Based Reasoning。
新智元第一时间跟进线索,发现 Roger Schank 确实在 2015 年底写了一篇文章,直言“不管他们说多少遍,IBM没在做‘认知计算’”。
Schank 在文中指出,尽管 IBM 一直声称 Watson 是认知计算系统,也常常在广告中宣传 Watson 的强大智能,但 Watson 其实根本不是认知计算系统;IBM 严重夸大了 Watson 的能力,有欺骗大众之嫌。
那么,什么是真正的认知计算系统呢?
Schank 在他1984年写的《认知计算机》一书中指出,认知系统是真正具有理解、推理和学习能力的系统,而一个系统若要进行真正的推理,它必须首先拥有目标、实现这一目标的方法,同时对其他人的知识理念以及过往经验的认知。
IBM认知计算营销误导公众?
那么, Watson 究竟是不是认知计算系统呢?先看看 IBM 是怎么宣传的:
IBM 的品牌内容与全球创意副总裁 Ann Rubin 曾表示,与那些以传统方式编程的电脑不同, Watson 这样的认知系统能够理解、推理和学习。因此,像银行、保险、医疗和零售等行业都可以从 Watson 这里受益。Rubin 还说,在数据量很大、很难从数据中发现洞见和联系的情境中, Watson 的智能已经超过了人类大脑;通过贯彻认知计算的思想,Watson 可以在癌症研究、风险评估、理性质疑等方方面超过人类。
听上去很强大的样子。确实,回顾 Watson 近年来的表现,它(还是该说“他”?)的确在某些领域超过了人。与 Watson 合作研究治疗肺癌的医疗机构 Wellpoint 的医生 Samuel Nessbaum 说,在试验中 Watson 对肺癌诊断正确的几率为 90%,相比之下人类医生只有 50%。
上面只是癌症研究的一个例子。近年来计算机科学的发展,让很多医疗机构都把癌症治疗赌在了认知计算和大数据上面,截止 2015 年底,Watson 已经从 1967 年到 2000 年的 470 万份专利和 1100 万份医药期刊中抽取了 250 多万种化合物,构建了一个强大的数据库——就像计算材料科学家使用机器学习算法加速新材料的发现,此举也确实有望大举加速新抗癌药物和疗法的研发。
然而,超过人 ≠ 能够进行认知计算,更谈不上拥有智能。
Shank 在他的那篇文章中就 Watson 不是认知计算系统做了如下论证——为了展示 Watson 的超凡智能,IBM 从 2015年以来在热播电视节目中投放了 Watson 的广告。在广告中,Watson 程序与摇滚灵魂人物鲍勃·迪伦进行了对话。Watson 告诉迪伦,它已经研读了迪伦的所有作品,并分析出迪伦作品的核心主题是“时间流逝”与“爱情凋零”。
Schank 以上述广告为例,论证 Watson 不具有认知计算能力。
Schank 指出,这个广告恰恰说明 Watson 完全没有理解迪伦的作品。尽管“时间流逝”之类的词汇在迪伦的作品中时常出现,但所有熟悉迪伦作品的人都知道,迪伦是一位抗争歌手,他的歌曲最关心的是民权、反战这些主题。不过,迪伦歌的歌词里并没有直白地写着“反战歌曲”、“民权运动”。Watson 只根据词频统计等方式找到“时间流逝”、“爱情凋零”,而没有真正理解迪伦作品的真正主题。
Schank 在 1969 年提出了自然语言理解中 Conceptual Dependency Theory,他表示在语言处理方面实际上有两类问题:第一类问题,是如何真正让计算机理解人的语言所表达的意义;第二类问题,则是让计算机通过计算文本中词语的频率来进行数据分析和机器学习,从而去统计文本之间的种种相关性(correlations),以及了解哪些词与哪些词更经常共同出现。对第二类问题的处理当然很有实用价值,因为它可以为企业等用户提供有用的信息。
不过,Schank 表示一个真正能进行理解和推理的认知系统不仅要能处理第二类问题,更要能处理第一类问题,能进行真正的理解。然而,Watson 无法解决第一类问题——理解问题。尽管它对迪伦说它知道迪伦作品的主题是什么,但实际上它并不理解、并不知道是哪些主题;它只是通过词频计算等方法,找到了那些迪伦歌曲中最常见的短语——但那并不是迪伦歌曲的主题。
人工智能传播“过火”了?
在 20 世纪 80 年代,人工智能研究曾经历过一段难熬的寒冬——实际上,人工智能研究经历过不止一次寒冬。Schank 指出,上世纪 80 年代那次寒冬出现的一大原因恰恰是,当时的许多研发者对人工智能进行过度吹捧,承诺了太多当时的人工智能实际上无法实现的东西。专家系统曾是那时的大热门,而当时的那些专家系统企业如今大部分已无影无踪。投资一窝蜂地涌来又一窝蜂地失望而去,结果寒冬到来,连那些真正有价值的人工智能研究也受到了连累。
因此,与其说 Schank 在指责 IBM,不如说他在担心媒体对人工智能的过度吹捧和炒作。
无独有偶,就在刚刚结束的谷歌 I/O 大会上,谷歌搜索、机器智能和网页部门的工程副总裁 John Giannandrea 也提到,近年来人工智能“可能有些过火了”,如果研究止步不前,AI 寒冬可能来临。
此前,新智元智库专家也就“人工智能过火”的议题做过讨论。任何产业“泡沫”出现都在所难免。华为终端智能化总监蒋洪睿主张辩证地看待问题。蒋洪睿认为,按照历史发展规律,当前人工智能的泡沫很有可能持续一段时间,而人工智能从业者“要做的就是在这个泡沫破灭之前,争取在学界和产业界做出更多的成绩来”。
更重要的是,这场辩论里也不能忘了 IBM 的声音。士隔三日当刮目相看,如今的 Watson 会如何回答 Shanck 的质疑呢?
参考资料: