1. SD 文生图参数


1.1. stable diffusion生成图片的最简单原理

从噪声图逐步去噪,最终形成结果


1.2. 迭代步数

  • 通俗理解
    • 从噪声图到成图,中间去噪多少次
    • AI画师画一幅画画了多少笔:AI画师画到第几笔,给到想要的结果
  • 推荐配置:30-40步

1.3. 采样方法

  • 通俗理解:把一张噪声图变成图像的方法
  • 区别
    • 最终结果效果
    • 是否收敛
    • 花费步数/时间
    • 风格、色彩
  • 新手推荐
    • euler a
    • euler
    • DPM++ 2M:Karras
  • 如何取消不需要的迭代器

1.4. 面部修复

  • 对面部进行识别和修复
  • 使用技巧
    • 在真实风图片中效果很好
    • 在动漫图片中效果不好

1.5. 平铺图

生成左右衔接的图。VR图片生成更合适


1.6. 尺寸

  • 作用:控制图片的大小
  • 使用技巧
    • 不可以直接生成超大图,画面崩坏
      • 理论知识:sd的模型 训练用图是512-512
      • 宽高控制在512-768
        • 否则画面比例不协调
        • 过小的分辨率导致图片质量低
        • 过大的分辨率会导致图片质量低
    • 宽度和高度与性能的关系
    • 点击箭头,交换宽高
    • 尺寸的设置应该与构图有关系
      • 512*512:适合人物、物件特写
      • 512*768:适合人物素材 半身,全身更合适
      • 768*512
        • 适合风景题材
        • 适合大广角视角

1.7. 高清修复

  • 基本原理
    • 先对图片进行放大
    • 再对图片根据重绘幅度,重新绘制
  • 参数设置
    • 放大算法
      • 二次元:R-ESRGAN 4x + anime6B
      • 三次元:R-ESRGAN 4x
    • 高分迭代步数
      • 0则表示与迭代步数保持一致
      • 15保底,如果效果好无需提高
    • 重绘幅度
      • 0.1-0.4:基本保持画面结构,细节调整逐步增加
      • 0.4-0.8:画面大修,但还会参照之前的构图
      • 0.8-0.9:基本重画,与原画面几乎没关系了
      • 1:和原图没关系了,重画
  • 使用技巧
    • 对人脸进行修复
    • 添加环境细节
    • 用lora还原人脸的情况下,重绘幅度不可以拉的太高

1.8. 多张图生成

  • 单批数量
    • 同时生成多张
    • 优点:相当于图片拼凑在一起同时生成,对显存的利用效率高
  • 总批次数
    • 每次生成[单批数量]张,依次生成
    • 优点:对显卡的需求低,但是生成图片时间更长

1.9. 提示词引导系数

  • 定义:Classifier-free guidance (CFG) scale(CGF指数)用来调节文本提示对扩散过程的引导程度
  • 作用:提示词引导系数值越高,图片越受提示词影响
  • 使用技巧
    • 保持在5-9之间最佳。如果生成画面有用力过猛的情况,调低CFG的值
    • 不要超过12,画面会崩

1.10. 随机种子

  • 基本原理
    • 决定了初始噪声图的噪声分布
    • 其它参数一样的情况下,随机数种子决定了图片的结果
  • 使用技巧:锁住随机种子,调整参数微调画面

results matching ""

    No results matching ""