我们正处在一个快速发展的信息时代,图像成为人们表达信息的常用方式,其与我们的生活息息相关,图像识别也变得越来越重要。图像识别的目的是为了让计算机跟人一样能够具有识别的能力,具体方式是将图像和字符等信息传入计算机当中,用计算机对图片进行处理,再用计算机去识别经过处理后的图像,那么计算机就拥有了视觉,具有了识别能力。目前,卷积神经网络(CNN)成为图像识别中准确而有效的方法。
据了解,微美全息(NASDAQ:WIMI)研发团队开发了基于卷积神经网络算法的图像识别系统。卷积神经网络是在人工神经网络的基础上发展起来的一种高效的识别算法。WIMI将卷积神经网络算法应用到图像识别技术,其表现出明显的优势,相比传统的机器学习算法,卷积神经网络实现了由计算机自己构建特征,由此突破了原有人为特征的分类效果瓶颈,使图像识别上升到一个新的台阶。另外,卷积神经网络结构比较特殊,能够把二维的图片作为输入层,这样不会丢失图像的一些本质特征,其将提高了图像识别的正确率。
在卷积神经网络(CNN)中,一层中的神经元不会连接到下一层中的所有神经元。相反,卷积神经网络使用三维结构,其中每组神经元都分析图像的特定区域或“特征”。CNN会按接近程度过滤连接(仅针对附近的像素分析像素),从而可以在计算上实现训练过程。它包含多个阶段的卷积和抽样过程,然后将提取到的特征输入到全连接层进行分类结果的计算。卷积层从上层中获得图像的特征,从输入层当中各个局域获得单元节点上的数据,这些单元节点需要覆盖整个数据集。卷积神经网络通过特征提取和特征映射过程,能够较好的学习到图像中的不变特征。
基于卷积神经网络算法的图像识别系统在图像处理中表现很出色,这主要是因为它拥有多层级网络结构和池化操作以及使用较少训练时间来产生尽可能好的效果的能力。卷积神经网络一般由三个或更多神经元组成并连接起来进行训练和推理。卷积层是卷积神经网络的核心部分。卷积的本质是利用卷积核的参数从数据中提取特征,通过矩阵点乘运算和求和运算得到结果。在全连接层中,对高维度的特征图进行线性拉伸处理,就能让高维特征图转化为一维向量,用于在分类器中进行分类或者回归处理。而激活函数在改变神经网络中输入与输出数据的数学关系中起到了关键作用,加入激活函数后,前一层的输出先被激活函数映射,得到了非线性函数,这样可以提高网络的学习及表达能力。
微美全息(NASDAQ:WIMI)开发的基于卷积神经网络算法的图像识别系统主要有以下优势:其一,它可以从多个图像数据集中提取特征、选择特征集以及从数据集中选择特征。 其二,它可以将许多小尺度单元连接起来进行学习和训练,从而可以通过学习不同尺度之间的关系来学习一系列重要参数并从中获得最优解;其三,它可以通过学习数据集之外的其他部分来训练,从而将更多信息从图像数据集中提取出来并且还可以更好地利用其他特征信息。在许多实际任务中,卷积神经网络使用池化层进行网络连接,以获得所需特征、并最终实现目标检测或目标识别;或者将不同层次间共享训练结果进行多分类、回归、图像分类等任务。
图像识别技术是人工智能的一个重要领域。在导航、资源分析、环境监测、医学研究等许多领域都有着重要的研究和应用价值。未来,WIMI也将不断拓展其开发的卷积神经网络算法的图像识别系统的运用场景。
领取专属 10元无门槛券
私享最新 技术干货