人工智能包含机器学习,机器学习包含深度学习。历史从推理为重点,到以知识为重点,再到以学习为重点的清晰脉络。1950年代明确提出来人工智能。
机器学习关注如何在数据(经验)学习中(自动学习和)改进算法的性能。学习的目的就是让机器获得知识。
深度学习属于机器学习的分支,是基于对数据进行表征学习的算法。2006年提出来的。人工神经网络为架构,以数据为基础进行表征学习的算法。模拟人脑来学习,来解释数据。包含多层非线性处理单元,每层都是用来进行特征的提取和转换,每层都会使用前一层的输出来作为输入。
机器学习和深度学习都是从数据中获得特征的表征,进而进行表征学习。
定义1:机器学习是对能通过经验自动改进的计算机算法的研究,即研究用数据自动优化自己的算法。
定义2:机器学习是用数据或过往经验优化计算法程序的性能,即用数据优化算法性能。
此处,经验 == 数据。
最简单的,用6个字表述:数据优化算法。 再加4个字:数据自动优化算法性能。
注意,这个定义也适用于深度学习。
反过来想,那些不是机器学习的算法,是不会因为有数据而自动改进其性能的,算法性能是在写好后就固定的。
在机器学习算法眼里,数据就是一堆特征的集合,学习的目标就是找到特征和标签的映射关系,即哪些特征组合可以映射为哪种标签。
学习映射关系是一个过程,需要反复优化迭代,这个过程就称为训练。训练完成的结果,是得到一个机器学习模型。
训练数据集和测试数据集。
总结:算法自动分析数据,从中找到规律,并对未来数据进行判断。
根据标签和环境交互方式区分机器学习:
关键是给数据做好标注,标注出来正确答案,与人类的“概念学习”类似。
学习过程不给出指导,数据也没有标签,没有正确答案。算法自动学习数据中的共同特征,把类似的聚在一起,也叫“聚类Clustering”,更像人类的自学。这种算法是静态分类,应该有对应地动态分类(强化学习?)。
使用神经网络作为算法模型。历史上是由人脑神经元传递信息的方式启发的,但现在的神经网络研究,与生物学的大脑神经系统研究,已经基本没有关系。
分层网络结构,类似于大脑中的神经元排列。非常擅长从数据中学习。“深度”指的是网络的层数,从2-3层到150层,将数据抽象成分层的数据信息。
学习的过程是由网络层之间的连接,和各个连接的权重来定义的。在训练中间,这些连接会自动调整,直到给出正确的答案。
通过四点对比来展示
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。