1. SD 文生图参数
1.1. stable diffusion生成图片的最简单原理
从噪声图逐步去噪,最终形成结果
1.2. 迭代步数
- 通俗理解
- 从噪声图到成图,中间去噪多少次
- AI画师画一幅画画了多少笔:AI画师画到第几笔,给到想要的结果
- 推荐配置:30-40步
1.3. 采样方法
- 通俗理解:把一张噪声图变成图像的方法
- 区别
- 最终结果效果
- 是否收敛
- 花费步数/时间
- 风格、色彩
- 新手推荐
- euler a
- euler
- DPM++ 2M:Karras
- 如何取消不需要的迭代器
1.4. 面部修复
- 对面部进行识别和修复
- 使用技巧
- 在真实风图片中效果很好
- 在动漫图片中效果不好
1.5. 平铺图
生成左右衔接的图。VR图片生成更合适
1.6. 尺寸
- 作用:控制图片的大小
- 使用技巧
- 不可以直接生成超大图,画面崩坏
- 理论知识:sd的模型 训练用图是512-512
- 宽高控制在512-768
- 否则画面比例不协调
- 过小的分辨率导致图片质量低
- 过大的分辨率会导致图片质量低
- 宽度和高度与性能的关系
- 点击箭头,交换宽高
- 尺寸的设置应该与构图有关系
- 512*512:适合人物、物件特写
- 512*768:适合人物素材 半身,全身更合适
- 768*512
- 适合风景题材
- 适合大广角视角
- 不可以直接生成超大图,画面崩坏
1.7. 高清修复
- 基本原理
- 先对图片进行放大
- 再对图片根据重绘幅度,重新绘制
- 参数设置
- 放大算法
- 二次元:R-ESRGAN 4x + anime6B
- 三次元:R-ESRGAN 4x
- 高分迭代步数
- 0则表示与迭代步数保持一致
- 15保底,如果效果好无需提高
- 重绘幅度
- 0.1-0.4:基本保持画面结构,细节调整逐步增加
- 0.4-0.8:画面大修,但还会参照之前的构图
- 0.8-0.9:基本重画,与原画面几乎没关系了
- 1:和原图没关系了,重画
- 放大算法
- 使用技巧
- 对人脸进行修复
- 添加环境细节
- 用lora还原人脸的情况下,重绘幅度不可以拉的太高
1.8. 多张图生成
- 单批数量
- 同时生成多张
- 优点:相当于图片拼凑在一起同时生成,对显存的利用效率高
- 总批次数
- 每次生成[单批数量]张,依次生成
- 优点:对显卡的需求低,但是生成图片时间更长
1.9. 提示词引导系数
- 定义:Classifier-free guidance (CFG) scale(CGF指数)用来调节文本提示对扩散过程的引导程度
- 作用:提示词引导系数值越高,图片越受提示词影响
- 使用技巧
- 保持在5-9之间最佳。如果生成画面有用力过猛的情况,调低CFG的值
- 不要超过12,画面会崩
1.10. 随机种子
- 基本原理
- 决定了初始噪声图的噪声分布
- 其它参数一样的情况下,随机数种子决定了图片的结果
- 使用技巧:锁住随机种子,调整参数微调画面