蓝猫训练营
用户7663
添加快捷方式
分享
Stable Diffusion 小白喂饭教程
输入“/”快速插入内容
Stable Diffusion 小白喂饭教程
Web
UI
界面及各个按钮说明
文生图
1.
当前使用的模型:所有的图片生成收到大模型的影响最大,一般使用最多是Chilloutmixd(现实主义)、Sd-v-1.5-inpainting、Anything-v3.0(二次元)等,一般来说,这三种模型已经可以满足新手炼丹的需求,常用的大模型还有国风、机甲、游戏人物、盲盒等,均在C站(
https://civitai.com/
)有相应的下载链接;
2.
当前使用的VAE(配合大模型使用的滤镜);
3.
clip跳过步数(contrastive language-image Pre-trainning 语言与图像对比训练):clip相当于SD理解提示词的大脑语言区,跳过的步数越多,生成的目标图片偏差越大;
4.
正向提示词:想要生成目标图中包含的元素;
5.
反向提示词:不想要生成目标图中不包含的元素(如果是在工作的时候炼丹,记得要增加
((((nsfw))))
这个咒语在第一行首字母,不然有时候容易有惊喜);
6.
采样迭代步数:对生成图像细节产生很大影响:(从小到大,对图片的精度越来越高,超过25往上,算法会放飞自我,目标图一般会崩坏,详见下图);
7.
采样方法:不同的采样方法产生的目标图会有偏差,详见下图,具体偏差值需要自己自行探索(正常情况下,euler a,DDIM,DPM++ 2M Karras这几个类型的采样方法可以满足炼丹要求);
8.
宽度、高度:用于确定生成目标图片的分辨率,不要因为
显卡
配置不足就不断降低目标图分辨率,太低只会得到难以完全绘制成型的像素噪点,类比小米上雕花。如果想生成大高分辨率图,可以先生成小图再去放大(后续会提及这个操作),直接生成2048*2048的图片会非常耗显存,容易黑图或者爆显存。
9.
生成批次和每批数量:
例:生成批次 1
每批数量 3
你去菜市场找高启强买鱼,只带了1个菜篮子,装了3条大鱼回家,单次买鱼数量很多,但是重量超标(对
显卡
要求高,需要高配置的显卡,出图效率会降低)
生成批次 3
每批数量 1
你分3次去菜市场找高启强买鱼,只带了一个菜篮子,每次都只装1条大鱼回家,单次购买的鱼数量不多,而且重量没有超标(对
显卡
的要求没有那么高);
10.
提示词相关性(Classfiler-free guidance):相关性的数值值越低,
AI
根据提示词生成的相关性就越高,反之生成图的对比度会越来越高,总结归纳如下
CFG 0-1值时:图片呈现崩坏
CFG 2-6值时:图片表现稍完整
CFG 7-12值时:图片表现完好且贴合关键词描述
CFG 10-15值时:对比度明显增强,且开始偏离提示词描述
CFG 18-30值时:图片开始崩坏,san值断崖下跌
参见下图;
11.
随机种子,生成图像的随机值。即使模型和所有参数相同,不同的种子值产生的图像会有很大差别。反之,如果所使用的模型、参数以及种子值都一样,生成的图像变化就会很小。右边的骰子🎲表示将种子值设为随机(-1),绿色循环标志 ♻️则可以重用上一张图片的种子值(类似将图片固定化),方便对满意的图片进行微调
12.
面部修复:可有效减少脸部崩坏概率(不适用二次元模型及目标图形);
可平铺:生成可以往左右上下连续拼接的图像
高清修复:一般用于修复脸部、细节,但是分辨率会随着变动,不建议面部修复和高清修复同时使用,容易爆显存;
13.返回按钮:用于返回上一个输入好的提示词;
14.删除按钮:删除所有提示词;
15.附加网络:可以调用出嵌入型模型,超网络模型以及大家最常用的
lora
模型;
16.模板按钮:确定将选中的模板提示词输入提示词框内(包含正向及反向);