中国版开源Sora?腾讯DynamiCrafter视频生成整合包
腾讯DynamiCrafter Logo
OpenAI开发的Sora模型以其创新的技术在视频生成领域引起了广泛关注。Sora能够根据文本提示创建最长60秒的视频,这些视频不仅逼真,而且展现了复杂的场景、生动的角色以及精巧的镜头运动。Sora的技术报告显示,该模型不仅能够理解用户的文本指令,还能够捕捉这些指令在现实世界中的物理表现。
Sora示例图片
Sora通过一个多步骤的扩散模型工作流程,从类似于静态噪声的视频开始,逐步精细化直至生成高质量视频。它采用了变换器架构,类似于GPT模型,处理范围更广的视觉数据。此外,Sora还借鉴了DALL·E 3的技术来生成描述性字幕,进一步增强模型遵循用户文本指令的能力。
尽管Sora目前尚未对外开放,我们可以先来体验腾讯团队与北京大学等合作开发的DynamiCrafter。这是一个图像动画生成工具,它可以根据文本提示为静态图像生成动画效果。DynamiCrafter支持高分辨率输出,并且提供优质的动态效果、更高的清晰度和一致性。
该工具适用于故事视频生成、循环视频制作和帧插值等多种应用场景。以下是DynamiCrafter生成的示例视频:
为了便于使用,学术Fun将DynamiCrafter打包成了一键启动包,用户可以免去配置Python环境的麻烦。下载地址:https://xueshu.fun/3812/,请在页面右侧点击下载按钮。
系统要求:
支持Windows 10/11 64位操作系统
至少20GB显存的NVIDIA显卡
CUDA版本不低于12.1
下载及使用指南
解压压缩包请确保解压路径中不含中文字符。解压后,双击启动.exe文件运行。
解压后的文件夹
启动服务打开浏览器并访问 http://127.0.0.1:7860/ ,即可开始在浏览器中使用DynamiCrafter。
DynamiCrafter用户界面
领取专属 10元无门槛券
私享最新 技术干货