人工智能、机器学习、深度学习这些名词经常会在各种场合听到,那具体有哪些区别呢?在业内来说,这几个概念还是有区别的,如果混用就会让人觉得是个门外汉。为了避免露馅成为外行,下面就来具体介绍一下每个概念以及它们之间的区别。
人工智能:模拟、延伸和扩展人的智能的理论、方法、技术及应用系统。人工智能是个很宽泛的概念,人类制造了各种机器之后,总希望这些机器越来越智能,这样人就可以越来越轻松,更好地享受生活。例如上图中提到的AGI(Artificial General Intelligence,通用人工智能),就是真正的AI,可以达到人类心智水平、能够通过图灵测试的机器(图灵测试的介绍见附录)。
但事实上,现在的机器在很多方面都已经远远超过了人类,但是也有一些方面和人类差距还非常大。例如进行计算,人类早已没法和机器PK,电脑的学名正是计算机,用来计算的机器,计算能力非常强大,计算速度非常快。但是有些方面的任务,比如操作灵活性,机器人还和人类有一定的差距;还有理解能力,机器在很多场景还都无法理解人类的意图,仍需要不断发展。
机器学习:研究计算机怎样模拟或实现人类的学习行为。机器学习的范围要窄一些,是一个具体的交叉学科,算法也非常多:随机森林、决策树、朴素贝叶斯分类、SVM(Support Vector Machine, 支持向量机)等等。机器学习很早就有很多相关研究,现在也仍然在有些问题上使用。跟机器学习特别相关的一个学科是特征工程,一般在应用上面列的这些机器学习算法之前,需要针对特定问题的数据提取特征。业界有这个说法:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。
深度学习:神经网络为代表很“深”的机器学习。这个解释是我个人给出的,仅供参考~深度学习,首先要很“深”。当然不是说这个技术里面水很深,而是这个技术本身就深J。深度学习的基础是神经网络,而神经网络往往层数越深,效果越好。在ImageNet竞赛中,从最初8层的AlexNet,Top5分类错误率为16.4%;到后来19层的VGG,Top5分类错误率为7.3%;再到152层的ResNet,Top5分类错误率为3.57%,趋势非常明显。
构成深度学习的神经网络也在不断发展,从最初的CNN(Convolution Neural Network,卷积神经网络),RNN(Recurrent Neural Network,循环神经网络),到现在的各种变体,如使用AutoML搜索出的AmoebaNet,Google发明的Transformer结构等等,本质还是各种不同的参数和连接,通过训练优化得到好的模型。深度学习现在很火,甚至可以说人工智能火就是被深度学习带火的,其原因还是效果好。深度学习大大提升了人脸识别、语音识别这些任务的准确率,使得很多之前不可能的应用成为可能,这是通用人工智能的必经之路,当然也是未来的方向。
附:图灵测试
图灵测试是指人和机器一起回答问题(可以是一连串的问题,并且不限定问题的类型),如果提问人无法区分哪个回答是机器给出的,哪个回答是人类给出的,那么这个机器就通过了图灵测试。
例如,提问者可以这样问:
问:你会下象棋吗?
答:是的。
问:你会下象棋吗?
答:是的。
问:请再次回答,你会下国际象棋吗?
答:是的。
这个回答很可能来自机器,因为只会固定规则的匹配。
但如果对话是这样的:
问:你会下象棋吗?
答:是的。
问:你会下象棋吗?
答:是的,你刚不是问过了吗?
问:请再次回答,你会下国际象棋吗?
答:我了个去,你才是机器人吧。
这个回答很可能来自于人。
当然,对于这种简单的循环提问,可以编程应付,但提问者可以发挥聪明才智,让机器防不胜防,所以想通过图灵测试还是非常困难的。像现在的微软小冰(本来想放一段和小冰的对话,结果微信显示小冰帐号被停用,屏蔽所有内容…只能放一段几个月之前的对话了),不难看出,聊天还是让人感觉非常生硬。
ImageNet竞赛介绍
ImageNet是一个有着1400多万张图片,2万多个类别的数据集。但ImageNet竞赛和现在网络上广为流传的数据集由126万张图片(训练集),1000个分类组成。竞赛的指标一般看Top5分类准确率,是指每张图片,模型输出5个类别选项,如果其中包含正确的类别,则记该图片分类正确。
公众号持续更新,欢迎订阅。
AI人工智能与大数据