Stable Diffusion 小白喂饭教程

Web UI界面及各个按钮说明

文生图

common.docs_name - LarkCCM_Docs_Menu_Image

当前使用的模型：所有的图片生成收到大模型的影响最大，一般使用最多是Chilloutmixd（现实主义）、Sd-v-1.5-inpainting、Anything-v3.0（二次元）等，一般来说，这三种模型已经可以满足新手炼丹的需求，常用的大模型还有国风、机甲、游戏人物、盲盒等，均在C站（https://civitai.com/）有相应的下载链接；

2.
当前使用的VAE（配合大模型使用的滤镜）；​

3.
clip跳过步数（contrastive language-image Pre-trainning 语言与图像对比训练）：clip相当于SD理解提示词的大脑语言区，跳过的步数越多，生成的目标图片偏差越大；​

4.
正向提示词：想要生成目标图中包含的元素；​

5.
反向提示词：不想要生成目标图中不包含的元素（如果是在工作的时候炼丹，记得要增加((((nsfw))))这个咒语在第一行首字母，不然有时候容易有惊喜）；​

采样迭代步数：对生成图像细节产生很大影响：（从小到大，对图片的精度越来越高，超过25往上，算法会放飞自我，目标图一般会崩坏，详见下图）；

采样方法：不同的采样方法产生的目标图会有偏差，详见下图，具体偏差值需要自己自行探索(正常情况下，euler a，DDIM，DPM++ 2M Karras这几个类型的采样方法可以满足炼丹要求）；

8.
宽度、高度：用于确定生成目标图片的分辨率，不要因为显卡配置不足就不断降低目标图分辨率，太低只会得到难以完全绘制成型的像素噪点，类比小米上雕花。如果想生成大高分辨率图，可以先生成小图再去放大（后续会提及这个操作），直接生成2048*2048的图片会非常耗显存，容易黑图或者爆显存。​

9.
生成批次和每批数量：​

例：生成批次 1

每批数量 3

     你去菜市场找高启强买鱼，只带了1个菜篮子，装了3条大鱼回家，单次买鱼数量很多，但是重量超标（对显卡要求高，需要高配置的显卡，出图效率会降低）​

生成批次 3

每批数量 1

     你分3次去菜市场找高启强买鱼，只带了一个菜篮子，每次都只装1条大鱼回家，单次购买的鱼数量不多，而且重量没有超标（对显卡的要求没有那么高）； ​

10.

提示词相关性（Classfiler-free guidance）：相关性的数值值越低，AI根据提示词生成的相关性就越高，反之生成图的对比度会越来越高，总结归纳如下

CFG 0-1值时：图片呈现崩坏

CFG 2-6值时：图片表现稍完整

CFG 7-12值时：图片表现完好且贴合关键词描述

CFG 10-15值时：对比度明显增强，且开始偏离提示词描述

CFG 18-30值时：图片开始崩坏，san值断崖下跌

参见下图；

11.
随机种子，生成图像的随机值。即使模型和所有参数相同，不同的种子值产生的图像会有很大差别。反之，如果所使用的模型、参数以及种子值都一样，生成的图像变化就会很小。右边的骰子🎲表示将种子值设为随机（-1），绿色循环标志 ♻️则可以重用上一张图片的种子值（类似将图片固定化），方便对满意的图片进行微调​

12.
面部修复：可有效减少脸部崩坏概率（不适用二次元模型及目标图形）；​

可平铺：生成可以往左右上下连续拼接的图像

       高清修复：一般用于修复脸部、细节，但是分辨率会随着变动，不建议面部修复和高清修复同时使用，容易爆显存;​

13.返回按钮：用于返回上一个输入好的提示词；

14.删除按钮：删除所有提示词；

15.附加网络：可以调用出嵌入型模型，超网络模型以及大家最常用的lora模型；​

16.模板按钮：确定将选中的模板提示词输入提示词框内（包含正向及反向）；​

Stable Diffusion 小白喂饭教程​

Stable Diffusion 小白喂饭教程