如果你想快速系统地串联计算机视觉领域的知识,人脸图像应该是最佳选择,其相关研究覆盖底层图像特征,目标检测与跟踪,图像分类和检索,图像滤波,图像分割,三维重建,风格迁移等方向,并且能够做到相互融合从而进行工业界落地。如果你还不知道人脸图像能做什么,不如看一看上面的1分钟视频,然后我们接下来细看到底都有些什么。
底层图像特征
或许很多经典的底层图像特征已经PK不过现在的深度学习模型学习到的特征,但是思想是永恒的,在人脸这个领域,有一些特征理解起来非常直观。
特征通常可以分为颜色特征、纹理特征、形状特征,下面我们看看在人脸方向有哪些很经典的东西。
第一个是肤色高斯模型,它是颜色特征。尽管人有白、黄、黑三种肤色,但研究证明,肤色在某些颜色空间上的差异性主要体现在亮度上,在色度上具有较好的聚类表现。因此根据肤色属性所具有的规律和分布情况对肤色建模,便可以将肤色与非肤色区域区分开。肤色高斯模型在早期可以常用人脸检测,现在也常用于辅助一些模型进行人脸区域的快速定位。
第二个是haar特征,它是纹理特征。脸部有一些固有的属性,比如眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。Haar特征通过对相邻图像块进行灰度比较,并使用积分图像进行快速计算,在大名鼎鼎的V-J算法中被使用。如果研究过OpenCV人脸检测算法的,不可能不知道。
第三个是形状特征,基于人脸特征关键点就可以计算出一系列的形状特征,因为人脸关键点是眉毛、眼睛、鼻子、嘴巴、脸部等有语义的特征点,每个人脸都通用却有独特性,对于光照姿态等有很强的不变性。
目标检测与跟踪
目标检测可以说是计算机视觉方向中从业者最多的了,不然也不会出现千篇一律的简历中写着跑过Yolo算法,人脸检测就是目标检测的一个子领域。
尽管通用的目标检测算法可以用于人脸检测,但是人脸检测依然有它的特点,比如早期的时候一些方法会挨个检测人脸的各个部位,然后组合成最终人脸。以MTCNN为代表的框架会把人脸检测和关键点检测问题进行联合处理。
而如今,在目标检测领域中的一些难题在人脸检测领域同样广泛存在,比如大姿态人脸、遮挡人脸、模糊小脸,甚至是伪造人脸,搞明白了人脸检测,目标检测还会是问题吗?
另一方面,工业界应用的时候不仅要做检测,还需要做跟踪平滑,此时常常需要应用卡尔曼滤波等传统算法,而不仅仅是一个模型就能搞定,更复杂完整的项目,才能更好地锻炼能力。
图像分类和检索
没有人不知道图像分类问题,而为我们所熟悉的人脸识别系统,其中一条典型的技术路线就是图像分类+验证+检索模型的组合。
以上图DeepFace为例,它首先对输入人脸经过3D对齐,然后使用数据集训练一个人脸分类器得到人脸特征提取网络,最后使用Siamese网络训练人脸验证网络。这样一来,就解决了人脸特征的问题,即将高维的人脸表达成了一个低维的特征,接下来就是进行人脸的聚类与检索。
如今人脸识别系统虽然已经大规模商业化,但并不意味着这里面就没有事情可以做了。遮挡人脸识别,跨姿态人脸识别,跨年龄人脸识别,妆造不变人脸识别,光照不变人脸识别,少样本人脸识别,3D人脸识别,视频人脸识别等都是现实存在的难题。
解决上面这些问题,不仅需要新的技术,也需要对分类检索等老技术的改进。
图像滤波
图像滤波是一类很底层的图像处理方法,在图像降噪,图像去模糊,图像修复等底层图像处理领域中是核心技术。那么在人脸图像中,又用在了哪里呢?大家或许不知道技术,但是不可能没有接触过,那就是人像美颜,熟的不能在熟的磨皮美白大法。
其中常见的方法包括均值滤波,双边滤波,引导滤波,以及针对这些方法的改进。掌握了核心技术,从人脸美颜迁移到其他的图像增强领域,就很自然了。
三维重建
三维重建即3D Reconstruction,在计算机视觉中,三维重建是指根据单视图或者多视图的图像重建三维信息的过程,通常需要从二维的图像投影恢复出物体的三维形状和纹理信息,这是接下来计算机视觉会取得突破的重点领域,而人脸的三维重建问题,实在是太典型了。
从基于单张图的3DMM等人脸通用模型与Shape from Shading(SfS)等优化方法,到基于多张图的立体视觉,基于视频的Structure from Motion(SfM),端到端的与端到端的模型,传统的与深度学习方法,这个领域涉及的算法非常多,而且难度较高。
另外,如何逼真地重建出人脸的细节信息,如何在二维的人脸被遮挡后还能进行重建,都是当前人脸重建领域要解决的难题,研究起来有足够的技术深度,一旦攻克也有大量商用场景。
另外3D与图形学有非常紧密的联系,使得这些技术在内容创作上有非常大的商业价值,难道你不想加入其中吗?
图像编辑与风格化
随着生成对抗网络等技术的发展,当前图像编辑与风格化正在成为计算机视觉领域的新热点,其中尤其是人脸图像落地能力最强,在人机交互,娱乐社交,内容创作等领域应用非常广泛。
从人脸年龄编辑、人脸卡通头像生成、换脸等全局性质的编辑,到人脸表情编辑,人脸发型,人脸化妆去妆等局部性质等编辑,几乎覆盖了图像编辑与风格化的所有关键技术。当前交互式,可控的编辑模型也是研究重点。
怎么规划学习路线
上面说了这么多,无非就是想告诉大家,作为打算长期在计算机视觉有所建树的同学,人脸图像是非常值得研究的,也是不可能绕过的,那么如何长期学习相关知识呢?下面介绍我们的两个内容。
(1) 2020年7月,有三的新书《深度学习之人脸图像处理:核心算法与案例实践》在机械工业出版社出版,这是一本讲述在人脸各个方向中的深度学习算法的书籍,同时配套有大量实战案例。
书中各章节内容如下:
第1章 人脸图像和特征基础
第2章 深度学习基础
第3章 人脸数据集
第4章 人脸检测
第5章 人脸关键点检测
第6章 人脸识别
第7章 人脸属性识别
第8章 人脸属性分割
第9章 人脸美颜和美妆
第10章 人脸三维重建
第11章 人脸属性编辑
这是市面上唯一一本将人脸各领域这几年的核心算法讲清楚的书,而且在可预见的几年内都可能如此。
领取专属 10元无门槛券
私享最新 技术干货