(本文阅读时间:2分钟)
人工神经网络模型(下文简称“神经网络”)的研究和发展也是以对生物神经网络的模仿为基础的。
▍神经网络模型简介
神经网络模型和其它模型不太一样,大多数其它模型都源于数学。比如:线性回归模型,最早由高斯发现并提出,并用来进行人口统计。
马尔萨斯在《人口论》里就曾经引用过这种模型,后来又对其进行了一些修正,逐步形成了现在的逻辑回归模型。
▍神经网络要素
神经网络的网络结构包括层数、每层的神经元个数以及是否全连接等。神经元不同、网络结构不同,神经网络也就不同,可以说神经元和网络结构定义了神经网络。
神经元的连接方式不同,神经网络也不同。即便是在全连接的情况下,输入数据加权之后的非线性处理方式也可能五花八门。
▍深度神经网络的发展
2006 年,加拿大多伦多大学的辛顿(Hinton)教授发表了一篇关于深度神经网络的论文,把当时硬件的发展和神经网络结合起来,将 GPU 应用到深度学习的训练中。
这一次运算力的问题终于被解决了,神经网络在理论研究和硬件设备两个必要条件都具备了。同一时期大数据技术的发展又为训练深层神经网络提供了原材料。
神经网络又一次被推上了高潮,深度神经网络成了学术界和工业界共同的青睐,深度学习领域也随之出现了。
▍深度学习
“深度学习”和前几期提及的“机器学习”最主要的区别是特征提取不同。机器学习的特征提取主要依靠人工,深度学习则可以全部交给神经网络去完成,操作时只需要把一个事物的所有特征全部导入就可以了。
在训练足够充分的前提下,深度学习模型的自适应性也比机器学习模型更好,当然对于资源和运算能力也会有相应的要求。
深度学习所需要的数据量跟机器学习完全不在一个量级,训练一个机器学习模型可能只需要几千个样本,训练深度学习模型至少需要几万个样本。
深度学习对数据的需求量这么大,它对计算能力的需求也相应地远远超过了机器学习模型。一个机器学习模型也许对硬件要求不高,训练的时间几分钟或几小时就够了,而深度学习模型必须使用带有 GPU 的机器才可以训练,训练的时间动辄十几、几十个小时,几周几个月都有可能。
一个机器学习模型也许对硬件要求不高,训练的时间几分钟或几小时就够了,而深度学习模型必须使用带有 GPU 的机器才可以训练,训练的时间动辄十几、几十个小时,几周几个月都有可能。
以上为“机器学习”和“深度学习”的不同之处,我们相信未来“深度学习”将在各个场景领域的应用会越来越广泛