【杂谈】一本书同时学分类，检测，分割，三维重建，GAN，难道它不香吗？文末送两本

文章来源：企鹅号 - 有三AI

如果你想快速系统地串联计算机视觉领域的知识，人脸图像应该是最佳选择，其相关研究覆盖底层图像特征，目标检测与跟踪，图像分类和检索，图像滤波，图像分割，三维重建，风格迁移等方向，并且能够做到相互融合从而进行工业界落地。如果你还不知道人脸图像能做什么，不如看一看上面的1分钟视频，然后我们接下来细看到底都有些什么。

底层图像特征

或许很多经典的底层图像特征已经PK不过现在的深度学习模型学习到的特征，但是思想是永恒的，在人脸这个领域，有一些特征理解起来非常直观。

特征通常可以分为颜色特征、纹理特征、形状特征，下面我们看看在人脸方向有哪些很经典的东西。

第一个是肤色高斯模型，它是颜色特征。尽管人有白、黄、黑三种肤色，但研究证明，肤色在某些颜色空间上的差异性主要体现在亮度上，在色度上具有较好的聚类表现。因此根据肤色属性所具有的规律和分布情况对肤色建模，便可以将肤色与非肤色区域区分开。肤色高斯模型在早期可以常用人脸检测，现在也常用于辅助一些模型进行人脸区域的快速定位。

第二个是haar特征，它是纹理特征。脸部有一些固有的属性，比如眼睛要比脸颊颜色要深，鼻梁两侧比鼻梁颜色要深，嘴巴比周围颜色要深等。Haar特征通过对相邻图像块进行灰度比较，并使用积分图像进行快速计算，在大名鼎鼎的V-J算法中被使用。如果研究过OpenCV人脸检测算法的，不可能不知道。

第三个是形状特征，基于人脸特征关键点就可以计算出一系列的形状特征，因为人脸关键点是眉毛、眼睛、鼻子、嘴巴、脸部等有语义的特征点，每个人脸都通用却有独特性，对于光照姿态等有很强的不变性。

目标检测与跟踪

目标检测可以说是计算机视觉方向中从业者最多的了，不然也不会出现千篇一律的简历中写着跑过Yolo算法，人脸检测就是目标检测的一个子领域。

尽管通用的目标检测算法可以用于人脸检测，但是人脸检测依然有它的特点，比如早期的时候一些方法会挨个检测人脸的各个部位，然后组合成最终人脸。以MTCNN为代表的框架会把人脸检测和关键点检测问题进行联合处理。

而如今，在目标检测领域中的一些难题在人脸检测领域同样广泛存在，比如大姿态人脸、遮挡人脸、模糊小脸，甚至是伪造人脸，搞明白了人脸检测，目标检测还会是问题吗？

另一方面，工业界应用的时候不仅要做检测，还需要做跟踪平滑，此时常常需要应用卡尔曼滤波等传统算法，而不仅仅是一个模型就能搞定，更复杂完整的项目，才能更好地锻炼能力。

图像分类和检索

没有人不知道图像分类问题，而为我们所熟悉的人脸识别系统，其中一条典型的技术路线就是图像分类+验证+检索模型的组合。

以上图DeepFace为例，它首先对输入人脸经过3D对齐，然后使用数据集训练一个人脸分类器得到人脸特征提取网络，最后使用Siamese网络训练人脸验证网络。这样一来，就解决了人脸特征的问题，即将高维的人脸表达成了一个低维的特征，接下来就是进行人脸的聚类与检索。

如今人脸识别系统虽然已经大规模商业化，但并不意味着这里面就没有事情可以做了。遮挡人脸识别，跨姿态人脸识别，跨年龄人脸识别，妆造不变人脸识别，光照不变人脸识别，少样本人脸识别，3D人脸识别，视频人脸识别等都是现实存在的难题。

解决上面这些问题，不仅需要新的技术，也需要对分类检索等老技术的改进。

图像滤波

图像滤波是一类很底层的图像处理方法，在图像降噪，图像去模糊，图像修复等底层图像处理领域中是核心技术。那么在人脸图像中，又用在了哪里呢？大家或许不知道技术，但是不可能没有接触过，那就是人像美颜，熟的不能在熟的磨皮美白大法。

其中常见的方法包括均值滤波，双边滤波，引导滤波，以及针对这些方法的改进。掌握了核心技术，从人脸美颜迁移到其他的图像增强领域，就很自然了。

三维重建

三维重建即3D Reconstruction，在计算机视觉中，三维重建是指根据单视图或者多视图的图像重建三维信息的过程，通常需要从二维的图像投影恢复出物体的三维形状和纹理信息，这是接下来计算机视觉会取得突破的重点领域，而人脸的三维重建问题，实在是太典型了。

从基于单张图的3DMM等人脸通用模型与Shape from Shading(SfS)等优化方法，到基于多张图的立体视觉，基于视频的Structure from Motion(SfM)，端到端的与端到端的模型，传统的与深度学习方法，这个领域涉及的算法非常多，而且难度较高。

另外，如何逼真地重建出人脸的细节信息，如何在二维的人脸被遮挡后还能进行重建，都是当前人脸重建领域要解决的难题，研究起来有足够的技术深度，一旦攻克也有大量商用场景。

另外3D与图形学有非常紧密的联系，使得这些技术在内容创作上有非常大的商业价值，难道你不想加入其中吗？

图像编辑与风格化

随着生成对抗网络等技术的发展，当前图像编辑与风格化正在成为计算机视觉领域的新热点，其中尤其是人脸图像落地能力最强，在人机交互，娱乐社交，内容创作等领域应用非常广泛。

从人脸年龄编辑、人脸卡通头像生成、换脸等全局性质的编辑，到人脸表情编辑，人脸发型，人脸化妆去妆等局部性质等编辑，几乎覆盖了图像编辑与风格化的所有关键技术。当前交互式，可控的编辑模型也是研究重点。

怎么规划学习路线

上面说了这么多，无非就是想告诉大家，作为打算长期在计算机视觉有所建树的同学，人脸图像是非常值得研究的，也是不可能绕过的，那么如何长期学习相关知识呢？下面介绍我们的两个内容。

(1) 2020年7月，有三的新书《深度学习之人脸图像处理：核心算法与案例实践》在机械工业出版社出版，这是一本讲述在人脸各个方向中的深度学习算法的书籍，同时配套有大量实战案例。

书中各章节内容如下：

第1章人脸图像和特征基础

第2章深度学习基础

第3章人脸数据集

第4章人脸检测

第5章人脸关键点检测

第6章人脸识别

第7章人脸属性识别

第8章人脸属性分割

第9章人脸美颜和美妆

第10章人脸三维重建

第11章人脸属性编辑

这是市面上唯一一本将人脸各领域这几年的核心算法讲清楚的书，而且在可预见的几年内都可能如此。

发表于: 2020-10-092020-10-09 08:44:17
原文链接：https://kuaibao.qq.com/s/20201009A029F100?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

【杂谈】一本书同时学分类，检测，分割，三维重建，GAN，难道它不香吗？文末送两本

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐