前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >你的数字人处在哪个阶段?

你的数字人处在哪个阶段?

作者头像
mixlab
发布于 2022-04-12 02:10:09
发布于 2022-04-12 02:10:09
5900
举报

- First Order Motion Model for Image Animation

# 功能 & 自评

无需对目标图像进行任何加注或者信息预处理,就可依据动画驱动数据源的动画轨迹来生成动画。

Our framework scores best on diverse benchmarks and on a variety of object categories.

#项目 & 论文地址

aliaksandrsiarohin.github.io/first-order-model-website

github.com/AliaksandrSiarohin/first-order-model

- TTS 技术

Test-To-Speech 使用语音 API 将书面文本转换为具有多种声音和语言的自然语音。用生成的语言与世界各地的客户交谈,创造更好的客户体验。

# vonage 专业文本转语音工具

# Synthesia 运用TTS + first order motion 的数字人视频生成工具

ML1726

上述案例多用于“离线式”的数字人应用场景。如果需要与数字人进行实时的交流沟通,有项目采用的是 ASR+TTS+Audio2face 方案。

ASR 自动语音识别 + TTS 文本转语音 +Voice2Face 语音控制驱动模型(声音数据对应的标签是模型动画的 blendshape 权重)

小杜

可以上手体验下开源项目,自己制作数字人

- FACEGOOD

FACEGOOD 将音频转换为混合权重(blendshape 权重),并在 UE 项目中驱动数字人小美。FACEGOOD为小美打造的Test部分和UE项目不提供商业用途,仅供测试使用。

#项目地址

github.com/FACEGOOD/Voice2Face

- Snap Camera

Snap Camera 可调用用户设备的摄像头,在任何平台使用摄像头输出头像或视频时均可使用Snap Camera的滤镜库

小杜

试试用 Snap Camera 迁入 Vland 元宇宙空间

小杜

用摄像头作为跨平台通用形象接入的切入口还挺简易高效的,只是效果渲染层面还有待提高哈,期待 摄像头—完全体数字人化身 产品的出现。

小杜

又来小酒馆玩耍了,这次小酒馆开业展示了不少精彩的作品,欢迎大家前去体验。分享一个十分惊艳的作品,介绍的是与生物设计与计算设计相关的内容,不容错过哦~

Mix宇宙小酒馆展览地址:

https://beta.vland.live/app/scene?eventId=61eec7e0f20ef01f63b7539a

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 无界社区mixlab 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档