先和大家汇报:
开源不到一个月,腾讯混元文生图大模型(混元DiT模型)的Github Star数已达到2.1k,位于开源社区热门DiT模型前列!
这是业内首个中文原生的DiT架构文生图开源模型,可供企业与个人开发者免费商用。
开源后,我们也听到了不少开发者的呼声:
需求收到,马上安排!👌
刚刚,腾讯混元针对文生图开源模型,发布一组「加速库」:
实测显示,加速后的生图时间缩短75%、生图速度提升4倍,大幅提升模型运行效率。
这也是业内首个由官方推出的加速库。
//生图速度,更快了
具体来说,这款加速器叠了两套buff:
一是,知识蒸馏
通过降低扩散模型迭代的步数实现加速(就像看学霸的笔记,跳过部分训练步骤,直接借鉴复杂模型的经验,掌握重点)。
使用蒸馏权重后,生成同等质量的图像,迭代步数减半。
二是,TensorRT推理加速
通过工程优化,减少冗余计算、合并层次、精简精度,让模型更快处理数据。
而且,它还支持与模型权重解耦(开发者可以在不影响模型权重的情况下,对模型进行优化和调整,满足不同的应用需求)。
为了提升开源模型易用性,我们还做了一些努力:
//使用方式,更简单了
现在,用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型。
(ComfyUI是一款文生图领域的WebUI界面设计,用户可以通过图像化的工作流的方式使用模型,大幅降低开发者的使用门槛)
(混元DiT文生图模型的ComfyUI使用界面)
//生态组件,更丰富了
仅用三行代码,用户就能在Hugging Face的官方模型库Diffusers中调用混元DiT模型,无需下载原始代码库。
(Hugging Face的Diffusers是知名的AI开源社区,也是调用各种主流文生图大模型的通用库,已成为当今文生图大模型使用的社区标准)
(混元DiT文生图模型的Diffusers界面)
腾讯正在持续投入开源大模型生态建设。
我们希望,用更快的推理体验、更简单的使用方式、更丰富的生态组件,进一步降低大模型技术的使用门槛,惠及更多开发者和用户。
附腾讯混元文生图开源大模型(混元DiT模型)项目链接
官网:https://dit.hunyuan.tencent.com/
代码:https://github.com/Tencent/HunyuanDiT
模型:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
论文:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。