四、参数栏
>>采样迭代步数
输出画面需要的步数,每一次采样步数都是在上一次的迭代步骤基础上绘制生成一个新的图片,
低的采样步数会导致画面计算不完整,高的采样步数仅在细节处进行优化,但会影响输出速度。无特殊需求一般来说大部分采样部署保持在20~30之间,一般默认20,30以上变化不大。
>>采样方法
stable diffusion的原理是基于扩散模型实现生成画像,它的过程 是将以一张满是噪点的图为基准,一点一点的向目标(prompt)“扩散”靠近。这就是扩散采样器工作的地方。这点有点像Octane渲染器物理渲染,简单来说,这些采样器就是一种算法,他的每一步之后将生成的图像与文本提示符要求的图像进行比较,然后对噪声添加一些更改,直到逐渐达到与文本描述相匹配的图像
常用的方法
- Euler a
速度最快的采样方式,最直接简单稳定的采样器
对采样步数要求低,同时随着采样步数增加并不会增加细节,会在采样步数增加到一定数值时,构图突变,所以不要在高部署情景下使用
适合场景:二次元图像,小场景
- DPM+ +2S a Karras
可以在速度与质量之间进行平衡,并生成更精确的图像及其细节
适合场景:二次元
- DPM+ +SDE Karras
跟2S a Karras差不多,相对于Euler a 来说,同等分辨率下细节会更多,比如可以在小图下塞进全身,代价是采样速度更慢
适合场景:写实风格,人像,复杂场景
- DDIM
很少会用到,出图快,可以快速生成高质量图像,但如果想尝试超高步数可以使用,随着步数增加可以叠加细节。
适合场景:写实人像,复杂场景
>>面部修复
修复扭曲的面部,对写实人像更有作用,二次元几乎没有
>>平铺图
用于生成花纹纹理的,常用于三维渲染
>>高分辨率修复
- 通俗来说,以重新绘制的方式对图像进行放大,并且补充一些细节
- 放大算法:用默认值即可
- 重绘幅度:不同重回幅度值造成的影响(一般选择0.4-0.7比较合适)
>>宽高设置
- 宽高比例决定画面内容,输出大小决定画面内容的信息量,很多细节例如全身构图中的脸部,饰品,复杂纹样等只有在大图才能有足够的空间表现,如果图片过小,比如脸部甚至会缩为一团,没有充分表现
- 绝大多数模型都是在512x512像素下训练的,少数在768x768下训练,所以当输出的尺寸比较大例如1024x1024的时候,ai就会尝试在途中塞入两到三张图片的内容量,于是就出现各种肢体拼接,不受词条控制的多个人,多角度等情况,增加词条可以部分缓解,但是更关键的还是控制好画幅,先算中小图,再放大为大图
- 生成的图片大小设置过大,计算慢,容易爆显存(推荐在512,768px的基础上生成)
如果有特定的参考图片,放到ps里,修改等比例尺寸r让高度和宽度数值务必保持一项在512768像素之内,另一尺寸可随意,如果想要更大尺寸,就用高清修复功能
- 方图512x512,会倾向于出脸和半身像
- 高图512x768,会倾向于出站着和坐着的全身照
>>生成批次/数量
- 生成批次:一批生成几次图片
- 生成数量:每批生成几张图片
- 生成图片数量=批次x数量
- 显卡配置不好的,不建议调节数量参数,建议更改生成批次,出图会更快
>>提示词引导系数(CFG Scale)
- CFG数值越高,Ai越听话,生成的图像与提示词越相关
- CFG在5-10区间比较安全,一般建议为7-10,根据实际情况减少或加大
- 一般默认:7足够,根据画面微调
- CFG数值越低,Ai越不听话,越自由发挥生成的图像与提示词的相关性越弱
>>随机种子数
- 用来控制随机性和锁定生成结果多样性的一个重要参数
- 点击骰子按钮可以将随机种子设为-1,也就是随机
- 点击回收循环按钮固定图片栏里面的图片的种子
- 变异随机种子:如果生成不够满意的画面,通过这个调出差不多的图片
五、插件
以上常用插件,例如:ControlNet,后面再做详细分享。
六、脚本
以上常用插件,例如:X/Y/Z图表,后面再做详细分享。
七、生图
>>生成按钮下图标的意思:
- 箭头:使用上一次生成的图像数据(包括政法提示词以及各系那个参数)
- 记事本:从提示词或上次生成的图片中读取参数
- 垃圾桶:清空正反提示词
- 红色相机:调出模型/lora等内容
- 笔记本:将所选预设样式插入到当前提示词之后
- 保存:保存提示词
若要修改之前保存的提示词模板,在SD文件下找到style文件,右键记事本方式打开,即可进行删改。(注:必须是要保存过一个模板后,才会生成这个文件)
- 蓝色循环:恢复生图进程
>>图片生成窗下的图标:
- 文件:生成的图片保存路径
- 打包下载:将批量生成的图片打包下载
- 发送到图生图,或者重绘,后期处理等操作
- 下面可看到图片详细参数(比如种子数量)