全栈工程师,关注一下。带你一起飞
开玩笑,不关注怎么带你飞
数字人模型来了
这次发布的模型是: Wan2.2-S2V-14B
用处是:图片+音频=视频
总参数量14B,最低显存占用52GB。
看了一下官方的效果,视频中人物不仅嘴巴可以动。
连表情,背景都可以动。
这次开源一步到位:推理代码、模型、技术报告,全上了!

示例图片来自: ModelScope魔搭社区 公众号
效果如何
下面的视频均来自: ModelScope魔搭社区 公众号
模型文件:
https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B/summary
Github:
https://github.com/Wan-Video/Wan2.2
在线体验(官网):
https://wan.video/
在线体验(魔搭):
https://www.modelscope.cn/studios/Wan-AI/Wan2.2-S2V
写代码累了,玩会游戏