前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >一张图生成定制版二次元人脸头像,还能“模仿”你的表情

一张图生成定制版二次元人脸头像,还能“模仿”你的表情

作者头像
AI科技大本营
发布于 2019-12-02 04:27:06
发布于 2019-12-02 04:27:06
2.2K0
举报
作者 | Pramook Khungurn

整理 | Jane、刘畅

出品 | AI科技大本营(ID:rgznai100)

【导读】最近,日本一位酷爱 Vtubers的粉丝结合了此前发表的多项 GAN 工作制作了两个动漫人物生成器的工具,这两个工具一个可以帮助广大动漫迷们快速、轻松的生成带有不同姿态的动漫人物形象,另一个可以帮助大家把真人脸表情移植到动漫人物上,以后你也可以定制你的“动漫Twins姐妹 / 兄弟”了。

作者不仅是一个资深 Vtubers 迷,对深度学习技术也很关注,也是在这两个兴趣共同激发下,促使了这两个工具:一个是基于单图就能生成动态动漫人物形象;第二个工具基于第一个工具,输入的单图改造,通过摄像头获取实时人脸图像的姿态特征赋予给动漫人物形象中。

人工智能技术是动漫创作的重要工具之一,作为一名深度学习调参师的自觉性,要了解这项工作的效果和方法,自然要赶紧学起来。

效果展示

copy 你的一颦一笑,不再话下。这两个工具是怎么做到的?我们先来看看最终成果的展示视频:

首先是第一个工具:基于GUI的单图动漫人脸表情生成器。

基于这一个工作的成功方法,作者还在这个系统中加入了人脸表情检测功能。这个动漫角色就可以实时模仿人脸的表情了。通过改变输入,用摄像头获取的人脸姿态表情特征,输入后让动漫人物 Get 到人脸表情同款:

有了第二个工作,作者也尝试把输入换成一段视频,当然方法同样奏效。

这么有意思,卡哇伊的工作是怎么做到的?下面我们会介绍一下模型、数据这两大方面的方法,但是在整个工作中,还涉及如何标注数据、图像数据处理规范、采样与渲染等诸多细节工作的处理,我们无法一一讲到,但是作者本人进行了详细的说明与介绍,大家可以仔细阅读项目。

项目地址:

https://pkhungurn.github.io/talking-head-anime/

方法介绍

(1)输入和输出

大家在上面的视频中可以看到,界面左侧表示的是输入的单幅动漫人物图像,中间罗列了 6 种姿态调节栏,每种姿态有一定的设置范围,可以多种姿态叠加使用,而右侧图像中则直接输出生成的效果图像。即整个工作只需要输入一张动漫脸和一个姿态(如一种表情),系统就可以在另一张背景中输出给定姿态的动漫脸。

(输入与输出)

(2)实现的主要两个环节

如何生成效果?这就是模型解决的问题,通过改变面部表情和控制表情幅度(眼睛或嘴巴的张开程度)来设计「面部表情」(Face morpher)与「面部旋转器」(Face rotator)两个独立模型。

(“两步走”系统)

(3)具体模型和方法

(模型总图)

近年来,GAN 在面部表情合成的诸多任务中都取得令人惊喜和和印象深刻的工作。2017 年,StarGAN 提出后,我们可以轻松调整图像中的发色、肌理、肤色、合成有趣的表情,随后,一种基于动作单元(AU)的新 GAN 模型——GANimation 被提出,在无监督训练后,只需要控制 AU 的激活程度,并选取几个 AU 进行组合,模型就可以生成表情转换,效果也很生动形象。

而这个系统中的「面部表情」模型就是基于 GANimation 模型设计的。那「面部旋转器」是如何做的呢?作者将 GANimation 模型与发表于 ECCV 2016 上一篇关于光流法的工作《View Synthesis by Appearance Flow》方法进行融合,第一步网络的输出是第二步网络的输入。

什么是光流法?光流是对物理世界中物体上各点实际运动速度的估计,解决这一光流估计问题的计算方法称为光流法。在《View Synthesis by Appearance Flow》工作中,主要解决的任务是根据输入图片中物体或场景的视角生成另一个视角的物体或场景,就好比当我们看到一个物体时,我们的大脑中也能想象出这个物体旋转后的样子。

《View Synthesis by Appearance Flow》

如果想了解更多这两篇论文,下面的地址用得上:

(1)关于 GANimation 模型,可阅读论文: https://www.albertpumarola.com/research/GANimation/index.html (2)《View Synthesis by Appearance Flow》 https://arxiv.org/pdf/1605.03557.pdf

貌似有了上面的介绍,如果我们想做这个项目,似乎还少了点什么?对,数据集。

(4)数据集

虽然现在有很多卡通、动漫人物,但是想要实现一些“动起来”的效果,如果只是我们下载的 2D 平面图像,肯定会影响效果,如果是 3D 的数据,肯定是最好不过了。

对角色进行 3D 建模,无论是人力还是物力成本都非常昂贵。如果能基于 2D 即时动态生成动漫图

为此,作者专门创建了一个新的数据集。作者从 MikuMikuDance 上下载了约 8000 个 3D 动画模型。并将数据集分成了三部分:训练集、验证集与测试集。

MikuMikuDance,简称 MMD,是一个免费的动画程序,可让用户制作动画并创建3D动画模型,

作者详细介绍了如何一步一步生成数据,如何训练Face Morpher的网络,如何融合两种算法造出了Face Rotator网络,并在最后给出了主观和客观的结果对比,为这位日本小哥严谨的学术态度点赞。

总结

该系统仅输入一张2D图像,便可以旋转、改变该图像的面部表情。不需要创建3D模型就可以实现会说话的动态动漫人物,大大降低了动画制作的成本,而且该系统易于使用。不过,未来还有可以继续 working on 的方向,如:

1、操纵自然场景下的动漫图像

2、修复现有模型带来的模糊、伪影等视觉效果

3、支持多种嘴、眼睛、眉毛的变化,使效果更逼真

4、从绘画图里面推断2.5D层模型或3D模型

项目地址:

https://pkhungurn.github.io/talking-head-anime/

(*本文为AI科技大本营整理文章,转载请微信联系 1092722531)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
让二次元妹子动起来,用一张图生成动态虚拟主播
我使用的方法结合了之前两项研究。一是 Pumarola et al. 2018 年的 GANimation 论文《GANimation: Anatomically-aware Facial Animation from a Single Image》,我将其用于修改面部的特征(具体来说是闭上眼睛和嘴)。二是 Zhou et al. 2016 年根据外观流实现目标旋转的论文《View Synthesis by Appearance Flow》,我将其用于实现人脸的旋转。
昱良
2019/12/03
2.2K0
让二次元妹子动起来,用一张图生成动态虚拟主播
只用一张图,就能让二次元老婆动起来,宛如3D:这全是为了科学啊
只要输入一张静态的老婆,就能让她动起来,会张嘴会眨眼,还能东张西望,抬眼看天。仿佛成了3D老婆。
量子位
2019/12/05
9840
只用一张图,就能让二次元老婆动起来,宛如3D:这全是为了科学啊
亲手养成一只自己的动漫主播!单张头像生成动画,可指定姿态或真人视频迁移
有个小哥因为对动漫网红主播太着迷了,于是他用深度神经网络简化了动画生成过程。具体来说,就是将动漫人物的脸部和期望的姿势等图像输入神经网络,从而生成给定姿势的输出图像。
大数据文摘
2019/12/06
2.4K0
大叔也能“变”萌妹?1张动漫头像就可以,说话唱歌样样行
不仅如此,动漫头像还能模拟你的口型和头部动作,实时“唱”出想要的效果来(作者亲自上场):
量子位
2021/02/26
6130
大叔也能“变”萌妹?1张动漫头像就可以,说话唱歌样样行
二次元的正确打开方式
去年发表的「Talking Head Anime」大家都看过了吧? 最近,这位谷歌工程师对算法进行了升级,「Talking Head Anime 2」效果更好! 只需要一张 PNG 二次元角色图片,就可以生成虚拟偶像,生成带面部表情捕捉的 Vtuber 角色。 作者亲自上场,动漫头像根据作者的口型和头部动作实时「演唱」,作者的完整视频: 老规矩,今天就教大家怎么玩! 1 算法原理 算法的核心思想是:给定某个动漫人物的一张人脸图像和六轴的姿态信息(Pose),生成同一人物的另一张人脸图像。 通过实时控制六轴
博文视点Broadview
2023/05/19
9200
二次元的正确打开方式
二次元的正确打开方式
最近,这位谷歌工程师对算法进行了升级,「Talking Head Anime 2」效果更好!
Jack_Cui
2021/03/03
6250
【技术综述】人脸表情识别研究
随着机器学习和深度神经网络两个领域的迅速发展以及智能设备的普及,人脸识别技术正在经历前所未有的发展,关于人脸识别技术讨论从未停歇。目前,人脸识别精度已经超过人眼,同时大规模普及的软硬件基础条件也已具备,应用市场和领域需求很大,基于这项技术的市场发展和具体应用正呈现蓬勃发展态势。人脸表情识别(facial expression recognition, FER)作为人脸识别技术中的一个重要组成部分,近年来在人机交互、安全、机器人制造、自动化、医疗、通信和驾驶领域得到了广泛的关注,成为学术界和工业界的研究热点。本文将对人脸识别中的表情识别的相关内容做一个较为详细的综述。
用户1508658
2019/07/25
4.9K0
【技术综述】人脸表情识别研究
动漫界的ImageNet来了!人脸数据集AnimeCeleb,240万张图片生成「萌萌哒」动漫脸
图片来源:https://huggingface.co/spaces/akhaliq/AnimeGANv2
新智元
2021/11/23
2.3K0
二次元会让人脸识别失效吗?
来源 | PyTorch 开发者社区 责编 | 寇雪芹 头图 | 下载于ICphoto 人脸识别也遇到坑了,识别得了三次元,却对二次元无效。迪士尼的技术团队,正在开发这一算法,以帮助动画制作者进行后期搜索。团队利用 PyTorch,效率得到很大的提高。 1923 年成立的商业帝国迪士尼以动画起家,至今引领着全球动画电影的发展。每一部动画电影的背后,都凝结了数百人的心血与汗水。自第一部电脑3D动画《玩具总动员》的上映,迪士尼就开启了数字化动画创作的征程。随着 CGI、AI 技术的发展,迪士尼动画电影的制作、
AI科技大本营
2023/05/08
5340
二次元会让人脸识别失效吗?
人人皆可二次元!小姐姐生成不同风格动漫形象,肤色、发型皆可变
机器之心报道 编辑:杜伟、陈萍 一张输入人脸图像,竟能生成多样化风格的动漫形象。伊利诺伊大学香槟分校的研究者做到了,他们提出的全新 GAN 迁移方法实现了「一对多」的生成效果。 在 GAN 迁移领域,研究人员可以构建一个以人脸图像为输入并输出人脸动漫形象的映射。相关的研究方法已经出现了很多,如腾讯微视此前推出的迪士尼童话脸特效等等。 在迁移过程中,图像的内容(content)部分可能会被保留,但风格(style)部分必须改变,这是因为同一张脸在动画中能以多种不同的方式表示。这意味着:迁移过程是一个一对多的映
机器之心
2023/03/29
4850
人人皆可二次元!小姐姐生成不同风格动漫形象,肤色、发型皆可变
3D视频人物肖像生成新突破!港科大、清华等发布AniPortraitGAN,面部表情、肩部运动全可控
目前用于人类生成相关的「可动画3D感知GAN」方法主要集中在头部或全身的生成,不过仅有头部的视频在真实生活中并不常见,全身生成任务通常不会控制人物的面部表情,并且很难提高生成质量。
新智元
2023/09/22
7180
3D视频人物肖像生成新突破!港科大、清华等发布AniPortraitGAN,面部表情、肩部运动全可控
绝了!分割mask生成动漫人脸!爆肝数周,从零搭建
很多小伙伴期待已久的实战项目来了,今天分享一个国外论坛medium大佬的文章,从 0 做项目的整个过程,具有很大的参考价值,大家感兴趣的可以试着参考这个思路去实现,比起直接跑别人现有的完整,一定能更有收获和成就感。
AI算法与图像处理
2022/04/06
1.1K0
绝了!分割mask生成动漫人脸!爆肝数周,从零搭建
GAN如此简单的PyTorch实现,一张脸生成72种表情(附代码)
【新智元导读】随着GAN的发展,单凭一张图像就能自动将面部表情生成动画已不是难事。但近期在Reddit和GitHub热议的新款GANimation,却将此技术提到新的高度。GANimation构建了一种人脸解剖结构(anatomically)上连续的面部表情合成方法,能够在连续区域中呈现图像,并能处理复杂背景和光照条件下的图像。
新智元
2018/08/01
1.8K0
GAN如此简单的PyTorch实现,一张脸生成72种表情(附代码)
CVPR 2018 中国论文分享会 之「人类、人脸及3D形状」
本文为2018 年 5 月 11 日在微软亚洲研究院进行的 CVPR 2018 中国论文宣讲研讨会中最后一个Session ——「Human, Face and 3D Shape」环节的三场论文报告。
AI科技评论
2018/07/26
5660
CVPR 2018 中国论文分享会 之「人类、人脸及3D形状」
最强AI人脸技术:一张图像合成动图
本文总结了来自三星莫斯科AI中心和Skolkovo科学技术研究所的研究人员提出的“Few-Shot Adversarial Learning of Realistic Neural Talking Head Models”,该模型的训练基于少量图像(few-shot),可以生成人物头像开口说话的动图。
用户1324186
2019/07/31
5K0
基础 | 如何通过DCGAN实现动漫人物图像的自动生成?
基于生成对抗网络(GAN)的动漫人物生成近年来兴起的动漫产业新技术。传统的GAN模型利用反向传播算法,通过生成器和判别器动态对抗,得到一个目标生成模型。由于训练过程不稳定,网络难以收敛,导致生成的图像缺乏多样性和准确性,甚至会产生模式崩溃。本文基于深度学习,参考相关实战项目pytorch-book,学习网络的训练方法,采用经过标准化处理和分类的动漫人物面部图像知乎用户何之源分享的素材,训练DCGAN,实现动漫人物图像自动生成。在训练过程中,控制实验参数,进行定量分析和优化,得到可自动生成动漫人物图像的生成器模型。主要工作如下:
公众号机器学习与AI生成创作
2020/09/14
3.7K0
基础 | 如何通过DCGAN实现动漫人物图像的自动生成?
一张照片生成视频,张嘴、点头、喜怒哀乐,都可以打字控制
在这项研究中,你只要给 AI 一张照片,它就能生成照片中人物的视频,而且人物的表情、动作都是可以通过文字进行控制的。比如,如果你给的指令是「张嘴」,视频中的人物就会真的张开嘴。
机器之心
2023/12/05
6920
一张照片生成视频,张嘴、点头、喜怒哀乐,都可以打字控制
学界 | AI 自动生成二次元妹子?或将替代插画师部分工作
AI科技评论按:最近二次元爱好者们可能会感觉到了一阵兴奋流遍全身。来自复旦大学、同济大学、卡内基梅隆大学和石溪大学共6位学生(其实本科都在复旦)搭建了一个利用人工智能自动生成精美动漫角色的网站 Mak
AI科技评论
2018/03/13
1.3K0
学界 | AI 自动生成二次元妹子?或将替代插画师部分工作
人脸表情和姿态变化万般丝滑——基于3D人脸动态的图像-视频生成方法
从单一的人脸图像生成其对应的视频是一个有趣的问题,研究者们通常利用人脸图像的稀疏特征点(landmarks)结合生成对抗网络(Generative Adversarial Networks, GANs)来进行人脸视频的生成。然而,由稀疏人脸特征点生成的人脸图像通常会遭受质量损失、图像失真、身份改变,以及表情不匹配等问题。
AI科技评论
2021/08/25
2.2K0
人脸表情和姿态变化万般丝滑——基于3D人脸动态的图像-视频生成方法
塔秘 | 宅男的福音:用GAN自动生成二次元萌妹子
导读:相信每个人都会被卡哇伊的二次元妹子萌到,我们很多人也可能梦想自己创作二次元人物,但奈何技艺不精、功力不足,得到的结果往往无法达到我们的期望。现在人工智能来帮你了!近日,来自复旦大学、纽约州立大学
灯塔大数据
2018/04/04
1.9K0
塔秘 | 宅男的福音:用GAN自动生成二次元萌妹子
推荐阅读
让二次元妹子动起来,用一张图生成动态虚拟主播
2.2K0
只用一张图,就能让二次元老婆动起来,宛如3D:这全是为了科学啊
9840
亲手养成一只自己的动漫主播!单张头像生成动画,可指定姿态或真人视频迁移
2.4K0
大叔也能“变”萌妹?1张动漫头像就可以,说话唱歌样样行
6130
二次元的正确打开方式
9200
二次元的正确打开方式
6250
【技术综述】人脸表情识别研究
4.9K0
动漫界的ImageNet来了!人脸数据集AnimeCeleb,240万张图片生成「萌萌哒」动漫脸
2.3K0
二次元会让人脸识别失效吗?
5340
人人皆可二次元!小姐姐生成不同风格动漫形象,肤色、发型皆可变
4850
3D视频人物肖像生成新突破!港科大、清华等发布AniPortraitGAN,面部表情、肩部运动全可控
7180
绝了!分割mask生成动漫人脸!爆肝数周,从零搭建
1.1K0
GAN如此简单的PyTorch实现,一张脸生成72种表情(附代码)
1.8K0
CVPR 2018 中国论文分享会 之「人类、人脸及3D形状」
5660
最强AI人脸技术:一张图像合成动图
5K0
基础 | 如何通过DCGAN实现动漫人物图像的自动生成?
3.7K0
一张照片生成视频,张嘴、点头、喜怒哀乐,都可以打字控制
6920
学界 | AI 自动生成二次元妹子?或将替代插画师部分工作
1.3K0
人脸表情和姿态变化万般丝滑——基于3D人脸动态的图像-视频生成方法
2.2K0
塔秘 | 宅男的福音:用GAN自动生成二次元萌妹子
1.9K0
相关推荐
让二次元妹子动起来,用一张图生成动态虚拟主播
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档