IT之家 8 月 1 日消息,首个国产纯自研视频大模型 Vidu 上线,目前向用户开放了文生视频、图生视频两大核心功能,提供 4 秒和 8 秒两种时长选择,分辨率最高为 1080P。用户无需申请,使用邮箱注册即可体验。
Vidu 模型于今年 4 月在 2024 中关村论坛首次亮相,由清华大学与生数科技联合发布,其核心技术 U-ViT 架构由团队在 2022 年 9 月提出,早于 Sora 采用的 DiT 架构,是全球首个 Diffusion 与 Transformer 融合的架构。
▲ 官方演示“画室中的一艘船驶向镜头”
经过 3 个多月的完善,Vidu 新增了角色一致性(Character To Video)、动漫风格、文字与特效画面生成等能力。
据介绍,Vidu 在构图、叙事和光影等方面,能达到接近电影级效果。Vidu 还能生成影视级特效画面,如烟雾、炫光效果、CG 特效等。
领取专属 10元无门槛券
私享最新 技术干货