作者 | Harper
审核 | gongyouliu
编辑 | auroral-L
机器学习的兴起
人们期望符号方法和人工智能规划在匹配模式数量有限的应用场景中发挥价值。比如说帮助我们完成报税表的程序。将表格、指令与处理数字的能力及一些启发式推理结合起来,这样就有了一个税务程序,它可以帮助我们完成报税,那通过我们前面介绍的启发式推理,我们就可以限制匹配模式的数量。但这种方法的局限性在于数据库很难管理,尤其是当规则和模式发生变化的时候,比如说恶意软件发展太快,反恶意软件公司来不及手动更新其数据库,同样,个人数字助理,比如说Siri,他也需要不断地适应主人提出的不熟悉的要求。
为了克服这些限制,早期的人工智能研究人员开始思考计算机是否可以通过编程来学习新的模式,他们的好奇心导致了机器学习的诞生。机器学习是一门让计算机去做他们没有特别安排去做的科学。其实机器学习的研究呢,在第一次人工智能会议后不久就开始了。1959年人工智能研究员Arthur’Samuel创建了一个可以玩跳棋的程序,这个程序与以往不同,他被设计来与自己博弈,这样就可以学会如何改进自己,他从玩的每一个游戏中学习新的策略,在很短的一段时间后,他开始不断地击败开发这款游戏的程序员。
机器学习的一个主要优点,是他不需要专家创建符号模式,并列出问题或者陈述的所有可能答案。机器自己创建和维护列表、识别模式并将其添加到数据库当中。
想象一下机器学习应用于中文房间实验。计算机会观察到自己和房间外的人之间的便条传递。在检查了成千上万的信息交流之后,计算机将识别出一种交流模式,并将常用的单词和短语添加到数据库当中,现在他可以使用自己收集的单词和短语更快速的破译收到的便条,并使用这些单词和短语快速组合成答案并且响应,而不必从所有字符集合中组合成答案再响应。它甚至可以基于这些匹配模式来创建自己的字典,以便直接响应收到的某些信息。但是呢,机器学习仍然被称为弱人工智能,因为计算机不理解所说的内容,他只匹配符号和识别模式,跟专家系统最大的区别在于计算机不是让专家提供模式,而是识别数据中的模式,随着时间的推移计算机就变得更聪明了。
机器学习已经成为人工智能中增长最快的领域之一,主要是因为数据存储和处理的成本已经大幅下降。我们目前正处于数据科学和大数据时代。超大数据集可以通过计算机分析来揭示模式、趋势和关联关系。各类组织正在收集大量的数据,最大的挑战是弄清楚如何处理这些数据。那解决这个问题的就是机器学习,它可以识别模式。从某种意义上说,机器学习,使得计算机能够找出数据中的隐含规律。
机器学习跨越了符号系统的限制。计算机系统使用机器学习算法来创建抽象概念的模型,而不是记忆符号。它利用机器学习算法对海量数据进行统计模式挖掘。就比如说查看不同的小狗的照片,机器学习算法会将这些图片分解成单独的点或者像素。之后,他观察这些像素来挖掘模式。
有的时候人类也可以帮助机器学习,我们可以给机器提供数百万张只包含小狗的图片,所以机器不用排除包含小猫、马或者飞机的图片,这就称为监督学习,而由小狗这种标签,和数百万张小狗的图片组成的数据就称为训练集。使用训练集就相当于一个人来教机器,告诉他所识别的所有模式都是小狗的特征。
而机器也完全可以自主学习,我们只是把大量的数据输入机器,让他找到自己的模式,那这就叫做无监督学习,比如说一台机器将检查你的手机上所有人的照片,他可能并不知道谁是你的好朋友,但是他可能会创造出一群他认为跟你关系最近的人,因为如果有很多你和某个人的照片,那你们肯定是比较亲近的。
领取专属 10元无门槛券
私享最新 技术干货