1、机器学习的概念
在 1950 年,图灵的论文《计算机器与智能》中提出了“学习机器”的概念 ,现在已经发展成 AI 科学中的一个独立分支。机器学习主要是设计和分析一些让电脑可以“自动学习”的算法,是一类从数 据中自动分析和获得规律 ,并利用规律对未知数据进行预测的算法。
从技术角度说,这一理论关注可以实现的,行之有效的学习算法 (要防止错误累积) 。
2、机器学习算法的分类
感知器算法
机器学习中最容易理解与实现的是监督学习与无监督学习 ,前者就是感知器算法的典型案例之一,它也是人工神经网络的基础。简要说来,监督学习是从给定的训练数据集中学习出一个函数,再接收到新数据时就可以根据这个函数预测结果。监督学习的训练集要求包
括 输入和输出,也可以说是特征和目标,训练集中的各项目标都是人为 标注的。
与之原理类似的,无监督学习就是目标没有人为标注 ,但还保有 训练集且同样要求输入和输出。
神经网络算法
这种算法可以视为多层感知器 ,除了输入输出层外 ,它还加入了若干隐藏层。隐藏层中的神经元节点可以与输入输出节点相连,每条链接上都有各自的权重系数,最终形成一个网络结构。之所以要加入 隐藏层,是因为现实中很多情况都不是简单的二元对立,总有这样那样的变化需要考虑。
3、强化学习算法
与监督和无监督学习更重视学习数据不同,强化学习是在给定的 数据环境下,让机器学习如何通过选择一系列行动来达成长期累计收 益最大化的目标。从本质上说,这种算法学习的是一套决策系统而非 数据 ,它在很多游戏中都有运用。著名的阿尔法狗 (AlphaGo)就 结合了强化学习与专家系统,能连续击败多位人类围棋高手,名噪一时。
通过前面的介绍可以发现,不论哪种机器学习算法,对特征的选 取和处理在模型训练中是很重要的,但在很多情况下要直接提取合适 且有效的特征是很困难的,如提取海量图片和句子的特征。此时的机 器学习就不能只局限于图片或句子的某一特征,而是它们背后隐含的复杂关系。因此需要结合深度模型进行自动计算,而模型主要是深度。
神经网络,这是一种更复杂的神经网络。深度学习算法就是采用类似的深层次结构进行机器学习的算法,目前大火的 ChatGPT 就运用了这种算法。
领取专属 10元无门槛券
私享最新 技术干货