Stability AI推出新的AI图像生成模型Stable Cascade，对比 SD2.1 的算力成本降低了10倍左右！

Python兴趣圈

发布于 2024-02-17 16:50:01

4620

文章被收录于专栏：翩翩白衣少年翩翩白衣少年

昨日，全球知名AI创新企业 Stability AI 推出了一款新的AI图像生成模型 Stable Cascade，并且同步在GitHub上开源了对应的微调、ControlNet 和 LoRA 训练的脚本。

Stable Cascade 是一款三阶段的文本到图像转换模型，利用高压缩率的潜在空间，实现了灵活性和高效性，提供优质的图像生成结果。

GitHub：https://github.com/Stability-AI/StableCascade

体验地址：https://huggingface.co/spaces/multimodalart/stable-cascade

该模型基于 Würstchen 架构，可以显著降低模型训练的算力成本，比 SD2.1 的算力成本降低了 10 倍左右。另外推理速度会比现有的 SD 模型快一倍左右。

重点

●🚀 模型由三个阶段组成，专注于图像压缩和生成。

●🌐 以非商业许可发布，支持普通用户硬件进行训练和微调。

●🔍 潜在生成阶段（C阶段）将用户输入转换为24x24像素的潜在空间，实现高效压缩。

●🔧 重点在C阶段进行额外学习和微调，A和B阶段可根据需要进行微调。

●💡 C和B阶段拥有不同的参数大小，减少硬件要求，同时提供高质量图像。

●🔬 在命令对齐和美学质量上超越其他模型。

●🎨 可以生成多样化图像和图像到图像的转换。

●📚 将公开训练、微调、ControlNet、LoRA的代码，支持更广泛的使用和定制。

更多功能：

除了标准的文本到图像生成之外，Stable Cascade 还可以执行图像变化和图像到图像生成。

局部重绘：输入与文本提示附带的蒙版配对的图像。该模型根据提供的文本提示填充图像的遮罩部分。

Canny Edge：通过跟踪输入到模型的现有图像的边缘来生成新图像。该测试也可以从草图进行扩展。

2x超分辨率：也可用于C阶段生成的潜在空间。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2024-02-14，如有侵权请联系 cloudcommunity@tencent.com 删除

cascade

本文分享自 Python兴趣圈微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度