Deep Learning(深度学习)是神经网络技术的一种。其最具变革性的一点是,只要有足够的学习数据,神经网络自身就可以将数据群的特征自动提取出来。在此之前的图像和数据的解析,需根据各个数据和问题进行析取算法的操作。但是,深度学习则不需要人为操作,而是自动提取特征。稍微粗略的说,就是这样的意思:只要向神经网络注入数据,就可以任意提取特征。
神经网络是将模仿被称为神经元的脑神经的单位进行链接,形成的网络状的图。输入的信号实现传播。神经网络在20世纪80年代出反向传播算法以来一个较大变革,是在2006年杰佛里·辛顿等人提出的一种被称为自动编码器的新的学习方法。该方法的特征之一是,可以让神经网络的各层进行阶段性学习。比如:让第一层学习将输入的信息原样输出,让第二层学习在第一层的基础上按照同样的方法再现输入,第三层以后同样操作。这样分阶段使之学习的神经网络,即使层数不断递进,仍然拥有强大的学习能力。
深度学习最擅长的是对图像数据和波形数据等无法形成符号的数据进行模式识别,通过输入层输入图像后进行阶段性学习。一般常用的神经网络的构造是各层全部连接到一起的感知型神经网络。
但如果是图像识别的话,采取特殊的连接方法会比较顺利。这个被称为卷积神经网络。参考人类大脑视觉皮质进一步将此发展的,是当时NHK放送技术研究所的福岛邦彦提出的神经认知机。它是深度学习的原型。其特征是,拥有对输入的数据进行不同大小切分并提取特征的多尺度中间层。比如,输入汽车的图像,从细节的样式到大的构造以及整体的轮廓都可以提取出来。
利用这一性质,深度学习也被用于围棋AI。2016年打败职业棋手的谷歌AlphaGo,将期盼整体输入,通过各种各样的尺度进行特征抽取。另外,使其对巨匠的绘画笔触进行学习,还有提取动画人物特征的相关研究。
这种深度学习大为活跃的背后,离不开计算机硬件性能的提升。特别是,神经网络市定型运算的重复,可以进行并列计算的部分较多也是其一个特征。因此,就能够利用搭载支撑游戏产业和计算机图形行业发展的GPU的图形板。现在,GPU是由数以百计的计算内核构成的并列运算装置,适用于深度学习的高速计算。图形板巨头NVIDIA,在自己公司的图形板中提供可以提高深度学习性能的库和架构。另外,在数据解析方面,谷歌公开了可以运用深度学习的架构“TensorFlow”。
深度学习是人工智能领域整体中的一个分野,虽然这个说法不太好,但在2000年前后,它并没有广泛流行。倒不如说,它是一个虽然拥有传统却不知该往何处去的分野。但是,有远见卓识的研究者的努力,使之发生很大的变革,一跃成为时代的中心。只不过,关于这些努力,有研究者认为较深度学习之前的神经网络有了飞跃性的提升,但与一下子接近人类这样的社会认识之间仍然有些差距。而且,要达到真正实用于社会,还需要时间以及经历一些阶段。现在,面向众多领域,以实用为目的的技术开发,正在全世界范围内快速进行着。
领取专属 10元无门槛券
私享最新 技术干货