首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

快手新动作!联合推出开源文生视频AI模型,效果如何?

【ITBEAR】近日,快手科技、北京大学和北京邮电大学携手,共同推出了Pyramid Flow文生视频模型。这款模型能够根据用户输入的文本,生成最长可达10秒、分辨率为1280x768、帧率为24fps的高质量视频。这一创新成果为开发者、艺术家和创作者们带来了更高效、更灵活的视频生成解决方案,并已在Hugging Face平台上线,实现完全开源。

Pyramid Flow的核心优势在于其高效生成的能力。该模型采用新技术,通过统一的AI模型分阶段生成视频,其中大多数阶段为低分辨率,仅在最后阶段达到全分辨率。这种“金字塔流匹配”方法在保持视频高视觉质量的同时,大幅降低了计算成本,其tokens数量仅为传统diffusion模型的四分之一。

在推理速度方面,Pyramid Flow同样表现出色。它能够在56秒内生成一个5秒、384p的视频,速度上媲美甚至超过了许多全序列diffusion模型。

Pyramid Flow在MIT许可证下发布,允许包括商业应用、修改和再分发在内的广泛使用。这一开源和商业友好的政策,吸引了众多希望将模型集成到专有系统中的开发者和公司。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OWRkUvohnGOuv9X-iXa9EwVg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券