Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >AI绘画Stable Diffusion进阶使用

AI绘画Stable Diffusion进阶使用

作者头像
Dlimeng
发布于 2024-05-24 06:03:18
发布于 2024-05-24 06:03:18
21600
代码可运行
举报
文章被收录于专栏:开源心路开源心路
运行总次数:0
代码可运行

本文讲解,模型底模,VAE美化模型,Lora模型,hypernetwork。 文本Stable Diffusion 简称sd 欢迎关注

使用模型

C站:https://civitai.com/ huggingface:https://huggingface.co/models?pipeline_tag=text-to-image

大模型(底模型)

stable diffusion webui 部署完成后,checkpoint是放底模 home\webui\models 目录下 常见模式:后缀ckpt/safetensors 常见大小:2G-7G

sdxl底模
sdxl底模
Anything
Anything

Realistic Vision:逼真的照片风格。 Anything v5:动漫风格。 Dreamshaper:写实绘画风格。

VAE美化模型

可以理解为滤镜,选择VAE就像给图片套上了一层滤镜,会改变图片原有的颜色风格;一般默认是无,而且有些大模型中会自带VAE 常见模式:后缀ckpt/pt 名字中带有vae

stable-diffusion-webui 默认页面并没有显示 VAE 设置部分,所以需要先设置一下。首先点击「Settings」,然后点左侧菜单的「User interface」这个 Tab,拉到下面有个选项叫做Quicksettings list,在输入框里面添加,sd_vae,CLIP_stop_at_last_layers:

在这里插入图片描述
在这里插入图片描述

最后点击上面的「Apply settings」,在点「Reload UI」就会重新刷新页面,即可看到头部的 VAE 区域:

可以去C站和huggingface下载 我们把这些 VAE 模型下载并把它放入到models/VAE目录下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.ckpt -O ~/workspace/stable-diffusion-webui/models/VAE/vae-ft-mse-840000-ema-pruned.ckpt
wget https://huggingface.co/AIARTCHAN/aichan_blend/resolve/main/vae/Anything-V3.0.vae.safetensors -O ~/workspace/stable-diffusion-webui/models/VAE/Anything-V3.0.vae.safetensors
wget "https://huggingface.co/AIARTCHAN/aichan_blend/resolve/main/vae/Berry's%20Mix.vae.safetensors" -O ~/workspace/stable-diffusion-webui/models/VAE/BerrysMix.vae.safetensors

所谓没有对比就没有伤害,对比明显可以感受到不加 VAE 图片优点灰蒙蒙的,不够鲜艳,另外是细节不够,而加了不同的 VAE 都有了更好的颜色效果,细节更全了 (微调)。

最后,注意不同的 VAE 适配的模型不同,也不是某个 VAE 可以用在任何模型下,否则可能会生成非常奇怪的图。

Lora模型

LoRA模型是通过截取大模型的某一特定部分生成的小模型,虽然不如大模型的能力完整,但短小精悍。因为训练方向明确,所以在生成特定内容的情况下,效果会更多。 常见模式:后缀ckpt/safetensors/pt 常见大小:100MB 模型下载并把它放入到models/Lora目录下

可以去C站下载搜索Lora模型

Embeddings

通过角色训练产出,能够让你的主模型识别某个指定的角色,因为你的主模型不可能每个角色都认识,通过文件名触发。 常见模式:后缀pt 常见大小:几十KB 模型下载放到webui\embeddings 可以去C站下载搜索Embeddings模型

Hypernetworks

通过画风训练产出,能够指定特定的画风! 常见模式:后缀pt 常见大小:几十KB 模型下载放到webui\models\hypernetworks 可以去C站下载搜索hypernetworks模型

功能类型选择

除了文生图,也可根据自己的需求选择其他选项卡进行操作,以下简单介绍正常流程会用到的选项卡:

图生图(img2img):将文生图的结果继续生成图片,或自己上传一张图片,常用于调整和优化图片,或修改图片风格、背景、人物形象等场景; 附加功能(Extras):对单张或批量图片进行缩放的操作; 图片信息(PNG Info):将本地图片上传后,可以用于其他选项卡的功能中; 模型合并(Checkpoint Merger):将多个模型进行不同权重的合并,从而获得一个新的模型; 扩展:SD的扩展插件配置区,可以查看已安装的插件内容,并控制开启和禁用状态;也支持通过URL的方式获取其他插件。

掌握提示词技巧

提示语输入基本要求

使用英语描述最佳,避免出现单词拼写错误;(不同模型可能有训练中文和日文,可自行判断)

标点符号同样使用英文半角进行输入;

建议使用逗号隔开的单词作为提示词;(也可用句号、甚至是空字符(\0)来分隔关键词,可以提高图像质量;

也可以使用自然语言描述图片内容,比如:A handsome hero armed with a sword(一个英俊的英雄装配着剑)

提示语描述和图像风格搭配,相近的描述不要重复出现

善于利用反向提示语来去除图片的负面效果;

尽可能使用特定含义的词汇,比如将 big 调整为 huge ,避免使用有多种含义的词汇;

避免使用with、and之类的连接词

可使用emoji(💰,💶,💷,💴,💵,🎊,🎀,👩) 进行补充描述;

逗号前后的少量空格并不影响实际效果;

可以通过指定风格提示语来创作带有特效或指定画风的图片;(风格获取参考下文👇)

姿势的描述越精简越好,否则容易出现肢体重复的情况;(肢体生成是AI硬伤,可用controlnet来解决)

避免过长提示词,越尾部的提示词在图片中的权重默认就越低,因此关键特征尽可能放在头部或通过语法来提高权重;(过长提示词可适当提高生成步数获取更好效果)

输入提示词技巧

输入模板 将自己构思的图片特征抽象为标签描述,并将标签按分类进行排列,以下为模板示例:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(quality), (subject)(style), (action/scene), (artist), (filters)

(quality) 代表画面的品质,比如 low res 结合 sticker使用来“利用”更多数据集,1girl结合high quality使用来获得高质量图像。

(subject) 代表画面主题,锁定画面内容,这是任何提示词基本组成部分。 (style) 是画面风格,可选。 (action/scene) 代表动作/场景,描述了主体在哪里做了什么。 (artist) 代表艺术家名字或者出品公司名称 (filters) 代表一些细节,补充。可以使用 艺术家,工作室,摄影术语,角色名字,风格,特效等等。

提示词语法 (word) - 将权重提高 1.1 倍 ((word)) - 将权重提高 1.21 倍(= 1.1 * 1.1),乘法的关系。 [word] - 将权重降低 90.91% (word:1.5) - 将权重提高 1.5 倍 (word:0.25) - 将权重减少为原先的 25% (word) - 在提示词中使用字面意义上的 () 字符 使用数字指定权重时,必须使用() 括号。如果未指定数字权重,则假定为 (权重增加通常会占一个提示词位,应当避免加特别多括号)

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(n)=(n:1.1)
((n))=(n:1.21)
(((n)))=(n:1.331)
((((n))))=(n:1.4641)
(((((n)))))=(n:1.61051)
((((((n))))))=(n:1.771561)

相关模板

正向提示语:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#万能画质要求#
(masterpiece, best quality),

反向提示语:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#避免糟糕人像的#
ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy,disfigured, poorly drawn face, mutation, mutated, (extra_limb),(ugly), (poorly drawn hands fingers), messy drawing, morbid,mutilated, tranny, trans, trannsexual, [out of frame], (bad proportions),(poorly drawn body), (poorly drawn legs), worst quality, low quality,normal quality, text, censored, gown, latex, pencil,
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#避免生成水印和文字内容#
lowres, bad anatomy, bad hands, text, error, missing fingers,extra digit, fewer digits, cropped, worst quality, low quality,normal quality, jpeg artifacts, signature, watermark, username, blurry,
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#通用#
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#避免变形的手和多余的手#
extra fingers,fused fingers,too many fingers,mutated hands,malformed limbs,extra limbs,missing arms,poorly drawn hands,

辅助工具推荐

标签参考 最全tag库(根据分类查找):https://danbooru.donmai.us/

颜色列表:https://en.wikipedia.org/wiki/List_of_colors_by_shade

表情符号:https://unicode.org/emoji/charts/emoji-list.html

标签冰山图:https://icebergcharts.com/i/Danbooru_Tags

美图灵感

C站:https://civitai.com/

OpenArt:https://openart.ai/discovery

prompthero:https://prompthero.com/

ptsearch(韩风):https://www.ptsearch.info/home/

arthub :https://arthub.ai/

lexica(艺术风格):https://lexica.art/

提示词工具

Danbooru 标签超市:https://tags.novelai.dev/ AI绘画提示词生成器:http://www.atoolbox.net/Tool.php?Id=1101 魔咒百科词典:https://aitag.top/

风格化标签 Stable Diffusion V1 Artist Style Studies(风格化总结): https://proximacentaurib.notion.site/e28a4f8d97724f14a784a538b8589e7d?v=42948fd8f45c4d47a0edfc4b78937474

艺术家风格:https://www.urania.ai/top-sd-artists Artists To Study:https://artiststostudy.pages.dev/

MidLibrary 这个网站提供了不同的图像风格,每一种都带有鲜明的特色:https://midlibrary.io/midjourney-style-classifier#styles-by-categories

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-05-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
赛博偶像速成指南
随着ChatGPT的爆火,最近和人工智能有关的各个部分也有一次爆火起来,由ai制成的美少女也是最近的一个爆火的话题,花了一点儿时间了解了一下,感觉还挺有意思的,现有的工具已经是非常成熟可用的东西了,接下来简单介绍一下怎么玩
LoRexxar
2023/03/16
1.3K0
赛博偶像速成指南
Stable Diffusion——外挂VAE模型
我们平时主要应用的是:Vae-ft-mse-840000-ema-pruned. Safetensors 因为它是最能接近实际拍摄的效果的。
红目香薰
2023/12/25
2.3K0
Stable Diffusion——外挂VAE模型
使用stable-diffusion-webui实战动漫化风景图
长期使用AUTOMATIC1111/stable-diffusion-webui的小伙伴,应该有了解,如果不使用特定的大模型或Lora,是很难生成整体上都符合要求的风景图。本文主要详述了制作一个学校的春夏秋冬的风景的过程。
buzzfrog
2023/10/07
9630
使用stable-diffusion-webui实战动漫化风景图
AI绘画专栏之statble diffusion入门(一)
我用夸克网盘分享了「SD启动器下载」,点击链接即可保存。打开「夸克APP」,无需下载在线播放视频,畅享原画5倍速,支持电视投屏。 链接:https://pan.quark.cn/s/b16bc4d3ff88
疯狂的KK
2023/11/07
1.2K0
AI绘画专栏之statble diffusion入门(一)
Stable-Diffusion|文生图 完蛋我被美女包围了人物Lora(四)
前面几篇: Stable-Diffusion|window10安装GPU版本的 Stable-Diffusion-WebUI遇到的一些问题(一) 【Stable-Diffusion|入门怎么下载与使用civitai网站的模型(二)】 Stable-Diffusion|文生图 拍立得纪实风格的Lora 图例(三)
悟乙己
2023/12/19
6830
Stable-Diffusion|文生图 完蛋我被美女包围了人物Lora(四)
在腾讯高性能应用服务HAI,StableDiffusion新人从0-1干货教程,一学就会系列!
Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词指导下产生图生图的转变。 它是一种潜在扩散模型,由慕尼黑大学的CompVis研究团体开发的各种生成性人工神经网络之一。(取自百度)
about me
2024/03/29
1K3
在腾讯高性能应用服务HAI,StableDiffusion新人从0-1干货教程,一学就会系列!
AI绘画StableDiffusion美女实操教程:斗破苍穹-小医仙
之前分享过StableDiffusion的入门到精通教程:AI绘画:Stable Diffusion 终极炼丹宝典:从入门到精通
AI飞行家
2023/08/26
2.2K0
AI绘画StableDiffusion美女实操教程:斗破苍穹-小医仙
AI绘画StableDiffusion实操教程:冰霜旗袍美女
飞书原文链接,获取更多资源:AI绘画StableDiffusion实操教程:冰霜旗袍美女
AI飞行家
2023/07/16
1.3K0
AI绘画StableDiffusion实操教程:冰霜旗袍美女
AI绘画:Stable Diffusion 终极炼丹宝典:从入门到精通
历经耗时数十个小时,总算将这份Stable Diffusion的使用教程整理妥当。
AI飞行家
2023/07/21
2.9K0
AI绘画:Stable Diffusion 终极炼丹宝典:从入门到精通
AI 绘画工具 Stable Diffusion 本地安装使用
最近要用到 AI 绘画,所以研究了下目前市面上的 AI 绘画工具,真可谓是琳琅满目,但主流的还是 Stable diffusion 和 Midjourney 两大阵营。
程序员树先生
2023/06/21
1.1K0
AI 绘画工具 Stable Diffusion 本地安装使用
AI绘画StableDiffusion实操教程:月光下的美人(含高清图片)
AI绘画月光下的美人教程整合资料包:https://pan.quark.cn/s/4a6325874b35
AI飞行家
2023/07/26
9050
AI绘画StableDiffusion实操教程:月光下的美人(含高清图片)
【零绘画基础程序员必学】AI绘画入门笔记01—Stable Diffusion上手体验
前几年火爆全球的AI图像生成如今已经成为了设计师的必备工作流,作为不会绘画的程序员,平时做PPT、写文档也常常被插图困扰,是时候系统地学习下AI生图工具Stable Diffusion了。
CS逍遥剑仙
2025/03/17
5101
Stable Diffusion WebUI 环境
Stable Diffusion 是热门的文本到图像的生成扩散模型,本文介绍了如何准备其 WebUI 环境。
GoCoding
2023/08/26
7640
Stable Diffusion WebUI 环境
教会你使用AI绘画利器Stable Diffusion
作者:corey 随着 stable-diffusion 的开源,让更多人有机会直接参与到 AI 绘画的创作中,相关的教程也如雨后春笋般的出现。可是目前我看到的教程同质性较高,通常只能称作为"使用流程讲解",但是通常没有对其原理和逻辑进行深入说明。 所以本文的目的,是用尽可能少的废话,给大家补充一些重要的相关知识。对于"怎么用"这类的问题,通常有别人已经讲解过,我就不会过多赘述(而是贴一个教程链接,请读者自己学习)。如果你想了解更多关于"是什么"、"为什么"的问题,那么本文将会给你更多的解答,尽可能让读者做
腾讯技术工程官方号
2023/04/29
3.4K0
教会你使用AI绘画利器Stable Diffusion
Stable Diffusion 姓氏头像
首先在【萌宝寻龙】新年IP | 百变萌宠龙宝宝的下载页面,找一个好看的图片,并复制其提示词,如下
崔哥
2024/04/21
2200
Stable Diffusion 姓氏头像
Stable Diffusion 认知以及 windows 下部署
对每个人而言,真正的职责只有一个:找到自我。然后在心中坚守其一生,全心全意,永不停息。所有其它的路都是不完整的,是人的逃避方式,是对大众理想的懦弱回归,是随波逐流,是对内心的恐惧 ——赫尔曼·黑塞《德米安》
山河已无恙
2023/12/19
6180
Stable Diffusion 认知以及 windows 下部署
利用colab实现AI绘画自由
最近AIGC真的很火,除了chatGPT外,AI绘画也是热度不减。最近也是决定抽空上手尝试一下,但奈何我的本本太渣,丐版Mac跑跑数据还行,跑Stable Diffusion根本没戏。所以还是决定白嫖谷歌的colab。
HsuHeinrich
2023/03/29
3.6K0
利用colab实现AI绘画自由
基于ChatGPT+Stable Diffusion实现AI绘画
近年来,AI 生成内容(AIGC)领域的飞速发展催生了诸多创新技术与应用,尤其是 AI 绘画。为降低构建 Prompt 的复杂性,本文基于 ChatGPT 实现了一个 Stable Diffusion 提示词生成器,支持多语言提示词和智能优化与扩展提示词,助力初学者轻松探索 AI 绘画世界~
腾讯云开发者
2023/08/03
1.3K0
基于ChatGPT+Stable Diffusion实现AI绘画
Stable Diffusion 硬核生存指南:WebUI 中的 VAE
本篇文章聊聊 Stable Diffusion 生态中呼声最高、也是最复杂的开源模型管理图形界面 “stable-diffusion-webui” 中和 VAE 相关的事情。
soulteary
2023/09/04
1.5K0
Stable Diffusion 硬核生存指南:WebUI 中的 VAE
音视频开发之旅(68)-SD文生图
1girl,smile,highres,wallpaper,in summer,landscape
音视频开发之旅
2024/02/24
3150
音视频开发之旅(68)-SD文生图
推荐阅读
相关推荐
赛博偶像速成指南
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验