前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人脸分析:用合成数据来代替真实数据

人脸分析:用合成数据来代替真实数据

作者头像
公众号机器学习与AI生成创作
发布2021-10-22 16:25:04
6530
发布2021-10-22 16:25:04
举报
文章被收录于专栏:机器学习与生成对抗网络

点击上方“机器学习与生成对抗网络”,关注星标

获取有趣、好玩的前沿干货!

杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI

相信吗?现在训练数据也用合成的了。

而且人脸分析任务上,准确性还不输真实数据的那种。

这是微软团队的一项最新研究,论文标题就已经说明了一切。

Fake it till you make it.

文章介绍了一种程序生成的3D人脸模型与一个合成数据库结合起来训练图像,结果人脸解析等任务上,效果与真实数据相当。

研究人员表示,为一些不可能实现人工标注的地方,开辟了新方法。

是不是以后真就告别人工标注了?!

如何实现?

要想让人脸数据集更加多样化、丰富化,靠收集和标注越来越难以实现。

且不说收集,比如网络抓取,可能带来重大的隐私和版权问题。而人工标注,很容易导致出错或者标签不一致的情况。

因此,研究团队就考虑用合成数据来增加或替代真实数据。然鹅,此前因为人脸模型本身复杂实现难度较为困难。

那么这次是如何实现的呢?

第一步,用程序生成合成面孔,包括身份、表情、面部纹理,以及发型和衣着,不同光线环境下的效果。

所有这些数据都是独立采样,提前“手动”去除噪音,以确保创建更多样化的个体。

比如在人脸模型上,就是这样滴~

还有像衣着,则是由服装设计师和模拟软体设计师手工制作的,共有30套各种各样的衣服。

还包括头饰(36件)、面具(7件)和眼镜(11件) 。

除此以外,还合成了标签。

接着到了训练阶段,研究人员创建了一个10万张分辨率为512 × 512的图像的数据集,并做了数据增强处理,共用了150 张NVIDIA M60 GPU渲染48小时。

此外,团队还训练了人脸解析网络(仅使用合成数据)和标签适应网络,以解决合成标签和人工注释标签之间的系统差异。

最终,人脸分析、地标定位等任务上的效果与其他采用真实数据的模型相当。

不过,研究人员也承认这项技术仍然有一定局限性。

比如人脸模型只有头部和颈部、无法模拟真实的皱纹、随机匹配人脸时会得到一些不合常理的面孔,比如有胡须的女性。

在接下来的工作中,他们计划将解决这些局限性。

好了,感兴趣的旁友可戳下方论文链接~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与AI生成创作 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何实现?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档