早在古代就应该有人幻想着制造能够自主思考的机器,至于最早能追溯到什么时候,恐怕很难考证。但是当世界上第一台可编程计算机被设计的同时,就开始真正的思考计算机能不能变得智能?
硬编码:知识库
人工智能发展初期,人们大多相信可以通过使用规则硬编码就可以实现,而事实上这类的符号人工智能仅适于解决明确的逻辑性问题,对复杂的图像处理、语言翻译等任务几乎没有效果。如今人工智能借助机器学习和深度学习,已经广泛的应用于多个领域,同时也成为学者关注的活跃课题。
早期的人工智能致力于相对朴素且形式化的环境中,通过一系列的形式化数学规则描述,高效的完成了对人类来说具有挑战的工作。1997年性能优异的深蓝战胜了人类的国际象棋的世界冠军,而深蓝主要由程序人员或工程师事先将国际象棋完全形式化后再描述给计算机。个人认为这不能算是人工智能。就像大机器生产,标准化的机器生产,促成了生产的信息化、提高了生产的效率。像这种机械化、大量重复性的工作对于人来说是不人道的,因此将生产过程形式化后,通过计算机来控制机器生产,这是早期计算机和人工智能的主要工作。毫无疑问的,将各种问题形式化的工作是由人类完成的,这个形式化描述工作本身就是一个不小的挑战,一个未被计算机自主解决的问题。想想吧:试图设计出特别复杂的形式化规则来精确的描述世界,着实是个不小的挑战。而且早期的人工智能还受限于计算机的性能。
基于规则的硬编码工作流程:
输入
人工设计的程序
输出
机器学习
为避免硬编码的知识体系的构建,人工智能需要具备自己获取知识的能力。而从原始数据中获取模式的能力就是机器学习。比如简单的机器学习算法逻辑回归和朴素贝叶斯可以辅助决策是否剖腹产,以及区分垃圾邮件等。当然了这些算法依赖于给定数据的表示,很多的时候是需要数据的收集和准确表示,即准确的提取一个特征集。比如医生,尤其中医正是通过“望”、“闻”、“问”、“切”等手段,获取相关数据,识别病症等特征,来诊断病情。从该角度来看,中医相对缺乏理论,更多的医药典籍等医疗手段都是通过长期的积累和特征识别,正是如今大数据的思路。并没有深追究个中的因果关系,没关注到底是什么药物成分有效。
然而有些时候,我们很难知道应该提取哪些特征?为解决这一问题,有一个方式是通过机器学习本身发掘表示本身,该方法被称为表示学习。该方法在减少了人工干预的同时,也提高了获取特征集的效率。从这种有人和无人参与的角度,可将机器学习分为监督学习和无监督学习。
经典机器学习的工作流程:
输入
人工设计的特征
从特征映射
输出
表示学习的工作流程:
输入
特征
从特征映射
输出
深度学习
目前,对人工智能最大的挑战是很难形式化描述的问题,而这些问题对人来说却容易的多,比如从图片中识别出动物、根据朋友的表情判断是否生气等工作。经过互联网的初步发展,积累了大量的各行各业的各种数据,基于大数据的人工智能进入公众的视野,引发了大量的思考。不少人顾虑人工智能对人类是否够友好?我只能说:真想多了,目前的人工智能没那么智能,距离我们的通用人工智能的距离远着呢。目前蓬勃发展领域主要有图像识别、语音识别、自然语言处理等。大多是通过深度学习的方式来完成实现的,即通过其他较简单的表示来表达复杂表示,以此解决表示学习中的核心问题。
深度学习的工作流程:
输入
简单特征
更抽象特征的额外层
从特征映射
输出
值得一提的是,深度学习的一个重要领域“强化学习”,可在没有人类操作者的情况下,自主的通过试错来学习执行任务。
领取专属 10元无门槛券
私享最新 技术干货