关于 SDXL 模型,之前写过两篇:
一晃四个月的时间过去了,Stability AI 团队终于发布了 SDXL 1.0。当然在这中间发布过几个中间版本,分别是 SDXL beta 和 SDXL 0.9。相较于 SDXL 0.9 的仅供研究的版本,这次的完整版本进步明显,是目前最好的开放图像生成模型。经过 Discord 上收集的实验数据,与其他开放模型相比,人们更喜欢 SDXL 1.0 生成的图像。
SDXL 可以生成几乎任何艺术风格的高质量图像,尤其擅长照片写实主义。SDXL 1.0 特别针对鲜艳而准确的色彩进行了精心调校,与之前的 Stable Diffusion 1.x 和 2.x 模型相比,具有更好的对比度和明暗表现。
此外,SDXL 可以生成图像模型难以渲染的概念,例如手和文本或空间排列的构图(例如,背景中的女人在前景中追逐狗)。
SDXL 只需要几句话就可以创建复杂、详细且美观的图像。用户不再需要调用“杰作”之类的限定词来获得高质量的图像。此外,SDXL 可以理解“红场”(著名的地方)与“红场”(形状)等概念之间的差异。
SDXL 1.0 是最大的开放图像模型,但对显存的要求并不高,在 8GB 显存的 GPU 上可以正常工作,覆盖了大多数消费级显卡和 GPU 云服务。
为了获得更加稳定的输出结果,我们通常借助 ControlNet,通过添加额外控制条件,来引导 Stable Diffusion 按照创作者的创作思路生成图像,从而提升 AI 图像生成的可控性和精度。目前还没有针对 SDXL 1.0 的 ControlNet 模型。好消息是,针对 SDXL 1.0 自定义数据微调模型比以往更加容易。Stability AI 团队正在构建下一代特定于任务的结构、风格和组合控件,其中 T2I / ControlNet 专门用于 SDXL,这些功能目前处于测试版预览阶段。
有多种方法可以开始使用 SDXL 1.0:
如果要在本地部署,推荐使用 Stable Diffusion WebUI (https://github.com/AUTOMATIC1111/stable-diffusion-webui)。关于 WebUI 的部署,网上的资料多如牛毛,这里就不赘述。
前往 https://huggingface.co/stabilityai,可以看到 SDXL 1.0 的模型已经有了。
点击 Files and versions,下载 sd_xl_base_1.0.safetensors 文件即可。
将下载到的模型文件放到 WebUI 的 models/Stable-diffusion 目录下即可。在 Web 界面上刷新并选择新模型即可。
可能会有人担心版权问题,这个不用担心,SDXL 1.0 根据 CreativeML OpenRAIL++-M 许可证发布。详细条款请参考:
https://github.com/Stability-AI/generative-models/blob/main/model_licenses/LICENSE-SDXL1.0
当然这份 license 读起来很是生涩。可以看看知乎上的解读:
https://zhuanlan.zhihu.com/p/626686691
涉及法律的条文,很难读,这里划重点:可商用,可以复制、使用和再分发。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有