原创内容
No.697
认真聊AI | 人工智能的起源、定义和流派
不整理不知道,一整理才发现我已经分享了59篇AI体验报告了,看来也真的是时候认真聊聊人工智能了~
图片由海艺AI绘制
作为一只数分狗+科幻迷,人工智能对我来说从来就不是一个陌生的概念。
chatgpt问世之后,我就成了大语言模型的忠诚用户。不但日常工作中积极使用这些生成式AI作为办公辅助工具,而且也做一些AI工具的使用体验分享,也算是对AI有相对深刻的见解吧。
最近更新频率没有那么高,就整理了一下已有的文章。整理的时候发现,我竟然已经分享了59篇人工智能相关的内容,从各种角度上来说我的AI浓度都已经超标了。
虽然我一直在强调对于普通人来说,其实会用AI远比了解AI背后的技术要重要。毕竟大语言模型作为一种工具,我们直接把它当作黑箱处理就够用了。然而作为一条数分狗,我在过去的实操工作中确实有用到一些算法模型来解决实际工作中遇到的问题的经历,就个人而言,对后台的技术和算法还是非常有兴趣的。
倒是看了不少人工智能和算法相关的专业书籍,远远算不上这个行业的专家,但是稍微写一点偏科普性质的小文章还是绰绰有余的。于是就有了这个新的系列文章:认真聊AI。系列计划对人工智能技术和背后的一些常用算法做一些简单的介绍。
反正多看多学总是不亏的。对于数分这个岗位来说,懂一点算法也是有好处的,可以不会写code,但是能说出原理123就已经是很大的加分项了。
虽然现在看起来人工智能一片大好,但其实人工智能到底是什么,如何定义它还是一件没有定论的事情。时至今日,这个定义依然存在争议。
不去做太远的溯源的话,人工智能的诞生还是挺清晰的,1956年的达特茅斯会议。这场会议给出的人工智能的定义是:制造一台机器,该机器可以模拟学习或者智能的所有方面,只要这些方面可以精确描述。除此之外,还有两种定义。第一种定义是:人工智能是一门科学,是使机器做那些需要人的智能来做的事情。第二种定义是:人工智能是关于知识的科学,研究知识的表示、获取和应用。
纠结哪种定义更合适是专家的事情,我们要知道的是,人工智能的讨论其实离不开的概念一共有三个:人、智能、知识。人和智能都太难以研究了,但知识却是相对简单的。同时,知识也智能这个概念的联系也十分紧密,没有知识谈何智能呢。所以一般来说,人工智能的研究的就是知识的表示、知识的获取和知识的应用。
然而知识本身就是一个非常大的话题,历史上对于知识有很多的讨论(可以戳这里看之前写得一篇讨论知识的小文章),然而一直没有一个完美的定义被提出。
不过有一点倒是明确,那就是知识的基本单位是概念。精通掌握任何一门知识都需要从概念开始,知识本身也不例外。所以人工智能研究的内容就变成了这么三个:如何定义一个概念,如何学习一个概念,如何应用一个概念。
一般来说,概念有三个功能:指物功能、指心功能和指名功能。
根据波普尔的三个世界理论,世界可以分为认知世界、物理世界和心理世界,三个世界虽然相关,但是又各不相同。概念的三个功能简单来说就是概念在三个世界中的作用。
指物功能是说概念可以指向客观世界的对象,这些对象可能是存在的也可能是虚拟的,可以指向一条现实中存在的狗,也可以指向不存在客观之物,比如鬼。或者说,指物功能是概念在物理世界的作用。
指心功能是说概念可以指向内心世界的对象,比如“资本家的走狗”,在现实世界中无论如何都不是一条狗。或者说,指心功能是指概念在心理世界的作用。
指名功能比较难以理解了,是指概念在认知世界中的作用。指向认知世界或者符号世界表示对象的名称符号。
为什么要提起这么抽象的概念呢,因为这涉及到人工智能的三个流派:专注于实现AI指名功能的流派称为符号主义,专注于实现AI指心功能的流派叫做连接主义,专注于实现AI指物功能的流派叫做行为主义。
符号主义者认为,只要在机器上是正确的,现实世界中就是正确的。或者说,只要指名正确了,指物就正确了。
符号主义给我们贡献了一个非常有名的思想实验:图灵测试。
图灵测试的基本流程是这样的:
隔离测试:测试者(人类)与被测试对象(可以是人,也可以是机器)隔离开来,他们之间只能通过键盘和屏幕进行交流。
对话环节:测试者通过键盘向被测试对象提问,被测试对象通过屏幕回答。
判断标准:如果测试者在交流过程中无法区分被测试对象是人还是机器,即认为机器通过了图灵测试。
图灵测试的核心思想是,如果机器能够在对话中模仿人类到让人无法区分的程度,那么这台机器就可以被认为是具有智能的。这个测试并不是用来衡量机器的智能程度,而是判断机器是否能够展现出与人类相似的智能行为。
这个测试就是一个基于指名功能的测试,然而指名指名功能实现了不代表指物功能就实现了。或者说图灵测试通过了也不代表机器真的具有了“智能”。中文屋实验就是对图灵测试的一个反驳:
想象一个只会说英语的人被关在一个房间里,房间里有一本中文翻译手册和一些中文字符。这个人可以通过手册将收到的中文字符转换成中文回答,然后传递出去。尽管他能够生成看似合理的中文回答,但实际上他并不理解中文的含义。
尽管以现在的目光来看,符号主义存在很多的问题,但是我们不可否认符号主义在人工智能研究的过程中依然扮演着重要的作用。
符号主义面临的挑战有三个:一是概念组合爆炸的问题,常识难以穷尽;二是命题组合悖论(两个合理的命题组合起来就难辨真假了);三是概念和知识在现实生活中很难得到和提取。
连接主义认为大脑是一切智能的基础。
关注大脑的结构和信息处理机制,并想办法在机器上模拟人脑,这种对于人工智能的研究流派就是连接主义。
深度学习技术就是连接主义的产物,虽然连接主义本身也是有问题的,但是我们不可否认连接主义也是人工智能技术的研究中扮演着重要的作用。
缸中大脑实验就是对连接主义的一种反驳:假设一个大脑被放置在一个装满营养液的缸中,并与一台计算机相连。这台计算机能够向大脑发送各种信号,模拟出与现实世界完全相同的体验。在这种情况下,大脑会认为自己处于一个正常的环境中,拥有身体,能够与周遭世界互动,但实际上它所体验到的一切都是计算机制造的虚拟现实。
连接主义面临的最大挑战就是时至今日,我们也不知道人脑的运行机制,也不清楚人脑中概念的具体表现形式、表现方式和组合方式等,现在的神经网络和深度学习虽然在模拟人脑,但是和人脑真正的运行机制还有很远的距离。
行为主义则认为智能不需要有知识、表示和推理,只要能将智能的行为表现出来就好。著名的波士顿功力的大狗机器人就可以被认为是这一流派的产物。
和前面两个流派一样,这一流派的也不是那么完美,完美伪装者和斯巴达人实验就说明了这个问题:一个人能够完美地模仿另一种语言的使用者的行为,尽管他不理解那种语言。这个思想实验表明,即使一个人的行为与拥有某种心灵状态的人无法区分,这并不意味着他们确实拥有那种心灵状态。因此,行为不能作为心灵状态的唯一决定因素。
这一流派最大的问题可以用莫拉维克悖论来解释:对人类来说简单的事情对于机器来说可能是复杂的,但是对机器来说简单的事情,对人来说可能是复杂的。
之后的内容会按照知识表示、知识获取和知识应用的顺序进行组织。
知识的表示,比如知识图谱;知识获取,比如搜索技术、深度学习技术;知识应用,比如自然语言处理、计算机视觉之类的。
感兴趣的朋友们可以订阅一下合集,后续不定期更新。
二号姬
半路出家自学成才的文科数据人,看过了大厂的风景也做过了小厂的CDO~目前是闲职,写写稿带带学生,欢迎勾搭~