近日,全球领先的AI研究实验室Stability AI震撼发布了一款名为“Stable Cascade”的全新一代文本生成图像模型。
这款基于创新Würstchen架构研发的模型,以其卓越性能与极致效率颠覆了现有文生图技术的认知边界,引发了业界广泛关注。
在官方发布的新闻通稿中,Stability AI明确指出,Stable Cascade旨在将高端图像生成能力引入消费级硬件平台,允许用户在常规设备上进行便捷的训练与微调操作。
相较于当前市场上的主力产品SDXL,Stable Cascade在整体效能和生成图片内容质量方面均实现了显著提升。
据了解,Stable Cascade的独特之处在于其新颖的数据处理流程。
当接收到用户输入的文字描述时,该模型会将其转化为一组24x24像素的小型数据集合,随后通过解码这些微小图像单元进而生成高分辨率的最终图像。
这种模块化设计使得模型能够在每个步骤独立运作,并能够针对特定环节进行灵活而细致的优化训练。
更值得关注的是,Stable Cascade因其“模块化”设计理念,在保持输出质量的同时,大大降低了对显存资源的需求。
官方宣称,即便仅配备20GB显存,此模型也能流畅运行,从而为更多开发者和普通用户提供更为亲民的使用环境。
Stability AI进一步对比展示了Stable Cascade与其他业内主流竞品如Playground v2、SDXL、SDXL Turbo以及Würstchen v2的性能差异。
据称,无论是在提示词对齐精度还是生成图片细节丰富度上,Stable Cascade的表现几乎独占鳌头。
原图
重建图像
尤其引人注目的是,尽管Stable Cascade的最大模型参数量较Stable Diffusion XL增加了14亿之多,但推理速度仍展现出令人惊叹的优势,实现实质性的突破。
综合以上比较,Stability AI坚信Stable Cascade在架构设计层面已经达到了一个崭新的高度。
它不仅保持了高质量图像生成的标准,还在此基础上成功地提升了推理效率,为文生图技术领域树立了新的里程碑。
随着Stable Cascade相关数据及代码已在GitHub上公开(仅供非商业用途),这一革命性的技术创新势必将引领新一轮的文生图应用热潮,并激发全球范围内的AI研究者们继续探索这一领域的无限潜力。
领取专属 10元无门槛券
私享最新 技术干货