近日,NEC宣布开发了更易于提高识别精度的深度学习自动优化技术。
以往进行深度学习时,很难基于神经网络构造(注1)进行调整,所以无法在整个网络进行最优化的学习,因而无法充分发挥其识别性。此次开发的技术, 可以基于其结构自动优化神经网络学习的进度,从而轻松实现比以往更加精准的识别。
此技术的出现,使得应用了图像识别及声音识别等深度学习技术的各个领域,均有望实现识别精度的进一步提高。例如,人脸识别和行为分析等视频监控识别精度的提高、基础设施等点检工作效率的提高,实现自动检测灾害、事故和灾难等。
一、背景
近年来,深度学习的研究取得了飞跃性的进展。在图像识别、声音识别等广泛领域内得到了应用。深度学习使用具备深层构造的神经网络,学习事先准备好的数据来实现高精度化。但是,如果数据被过度地学习,则会出现“过学习(注2)”的现象,即只能高精度地识别学习过的数据,而未用于学习的数据的识别精度则降低。为了避免这种情况的发生,就需要使用“正则化(注3)”技术进行调整。
由于神经网络的学习过程因其结构而复杂多变,所以过去只能对整个网络使用相同的正则化技术。结果出现了网络各层有的过度学习,有的学习停滞等问题,因而很难充分发挥原有的识别性能。另外,由于手动调整各层的学习进度极为困难,所以对于逐层自动调整学习进度的需求呼声很高。
此次开发的技术是基于神经网络的结构,逐层预测学习进度,并自动配置适合各层进展的正则化技术。通过此技术,在整个网络中学习被优化,并且可以将识别错误率降低约20%,改善识别精度。
【图】各层神经网络中正则化技术自动设置示意图
二、新技术的优点
1、根据神经网络结构的自动学习优化
基于神经网络的结构,我们预测每层的学习进度,并逐层自动设置适合于各层进展的正则化。据此,整个网络的学习进度就得到了优化,解决了过去各层过度学习和学习停滞的问题。在使用该技术的手写数字数据的识别实验中,识别错误率降低了约20%,识别精准度已经得到明显改善。
【图】相对于学习数据量的识别错误率的变化
2、与以往相同的计算量下,轻松实现高精度
该技术仅在学习神经网络前实施一次,即可在与以往同等的学习计算量下轻松地实现高精度。
NEC集团致力于在全球范围内推进社会解决方案,提供安心、安全、高效、公平的社会价值,将先进的ICT技术与知识相融合,为实现更加光明、更加丰富多彩的高效社会尽一份力量。
(注1) 神经网络:由人造神经细胞(神经元)组成的神经网络。
(注2) 过学习:对给定数据过度学习,而对未学习的数据的识别精度度下降的现象。
(注3) 正则化:通过对模型的复杂性加以约束,来抑制过学习的方法。
领取专属 10元无门槛券
私享最新 技术干货