第四章: Stable Diffusion参数调优

采样器详解

什么是采样器(Sampler)

采样器决定了AI如何从"噪声"逐步生成清晰图像的算法。不同采样器影响:

生成速度: 从5秒到60秒不等
图片质量: 细节、清晰度、色彩
风格倾向: 偏写实/偏艺术

采样器分类与对比

1. Euler系列(快速,适合新手)

Euler a (Ancestral):

特点: 快速、随机性强、每次生成差异大
速度:  (最快)
质量: 
推荐Steps: 20-30
适合场景: 快速预览、探索创意
不适合: 需要精确复现的场景

Euler:

特点: 比Euler a稳定,相同种子可复现
速度: 
质量: 
推荐Steps: 20-30
适合场景: 插画、艺术风格、日常使用

2. DPM++系列(平衡,最推荐)

DPM++ 2M Karras (最常用):

特点: 速度质量平衡最佳,稳定性好
速度: 
质量: 
推荐Steps: 20-25
适合场景: 写实人像、摄影风格、通用场景
推荐指数:  (最推荐新手)

DPM++ SDE Karras:

特点: 质量稍高于2M,但速度慢
速度: 
质量: 
推荐Steps: 20-30
适合场景: 精细人像、高质量作品

DPM++ 2M SDE Exponential:

特点: 2024新算法,细节更好
速度: 
质量: 
推荐Steps: 20-28
适合场景: 专业级输出、商用图

3. UniPC系列(极速)

UniPC:

特点: 低步数即可出图,适合批量生成
速度: 
质量: 
推荐Steps: 15-20 (10步也能出图)
适合场景: 测试提示词、批量生成

4. DDIM/PLMS(经典老算法)

DDIM:

特点: 最早期算法,可复现性好
速度: 
质量: 
推荐Steps: 25-40
适合场景: 需要精确复现的场景
现状: 已被DPM++系列取代

采样器选择建议

使用场景	推荐采样器	Steps	说明
日常通用	DPM++ 2M Karras	20-25	速度质量最佳平衡
写实人像	DPM++ SDE Karras	25-30	细节最好
二次元插画	Euler a	25-30	随机性带来惊喜
快速预览	UniPC	15-20	10秒出图
精确复现	Euler	25-30	相同种子稳定
专业输出	DPM++ 2M SDE Exponential	25-30	2024最新

采样器实战测试

测试方法: 相同提示词、种子、参数,仅改变采样器

Prompt: a beautiful girl, professional photography, 8k uhd
Seed: 123456
CFG: 7
Size: 512x768

测试结果(生成时间对比,RTX 3060):
- Euler a: 8秒,风格偏柔和
- DPM++ 2M Karras: 12秒,细节清晰,皮肤质感好
- DPM++ SDE Karras: 18秒,质量最高,发丝最清晰
- UniPC: 6秒,质量可接受

结论: 日常使用DPM++ 2M Karras,追求质量用SDE,赶时间用UniPC。

CFG Scale详解

CFG是什么

CFG (Classifier Free Guidance Scale) = 提示词遵循程度

CFG = 1:   完全忽略提示词,随机生成
CFG = 7:   平衡创造力和遵循度 (推荐)
CFG = 20:  严格遵循提示词,但可能过曝/不自然

CFG数值对比

CFG值	效果	适用场景	问题
1-3	忽略提示词,极具创造力	艺术实验	与描述不符
4-6	较宽松,有随机性	二次元、插画	细节可能缺失
7-9	平衡,最推荐	写实人像、通用	无
10-12	严格遵循提示词	商业设计、精确需求	可能过于死板
15+	极度遵循,可能过曝	特殊需求	画面不自然、过曝

CFG实战示例

案例1: 人像摄影

Prompt: a girl, smile, garden, sunlight
Steps: 25, DPM++ 2M Karras

CFG = 4:  画面柔和,但女孩可能不笑
CFG = 7:  女孩微笑,花园清晰,光线自然  最佳
CFG = 12: 女孩笑容明显,但阳光可能过曝
CFG = 18: 过曝,颜色不自然

案例2: 二次元角色

Prompt: 1girl, blue hair, school uniform, anime style
Model: Anything V5

CFG = 5:  风格柔和,随机性强,适合探索 
CFG = 7:  细节清晰,标准质量 
CFG = 12: 线条过硬,颜色饱和度过高

CFG调优策略

不同模型的最佳CFG:

写实模型(Realistic Vision, ChilloutMix):
CFG: 6-8
原因: 写实模型对CFG敏感,高CFG易过曝

二次元模型(Anything, CounterfeitV3):
CFG: 5-9
原因: 二次元容错率高,低CFG也有好效果

艺术风格模型(DreamShaper, Pastel Mix):
CFG: 7-11
原因: 艺术风格需要更高指导

LoRA加持:
CFG: 降低1-2 (如原本7,改为5-6)
原因: LoRA已强化特定特征,不需高CFG

Steps(采样步数)

Steps含义

采样步数 = AI从噪声到清晰图像的迭代次数

Steps = 10:  模糊、不完整
Steps = 20:  基本清晰  性价比最高
Steps = 30:  细节优化
Steps = 50+: 提升极微小,浪费时间

Steps与质量的关系

实测数据 (DPM++ 2M Karras, RTX 3060):

Steps	生成时间	质量评分	性价比
10	5秒	60分
15	7秒	75分
20	10秒	85分	(最佳)
25	12秒	90分
30	15秒	92分
40	20秒	93分
50	25秒	93.5分	(浪费)

结论:

20-25 Steps是性价比最高区间
超过30 Steps提升不明显
UniPC采样器15步即可

不同采样器的推荐Steps

Euler a / Euler: 25-30 Steps
DPM++ 2M Karras: 20-25 Steps  推荐
DPM++ SDE Karras: 25-30 Steps
UniPC: 15-20 Steps (10步也能用)
DDIM: 30-40 Steps

Steps优化技巧

1. 快速预览模式:

Steps: 15
Sampler: UniPC
目的: 快速测试提示词,5秒出图

2. 日常创作模式:

Steps: 20-25
Sampler: DPM++ 2M Karras
目的: 平衡质量和速度

3. 精品输出模式:

Steps: 28-30
Sampler: DPM++ SDE Karras
目的: 追求极致质量

4. 批量生成模式:

Steps: 18-20
Sampler: UniPC
Batch: 4-8张
目的: 快速生成多张候选

分辨率设置

基础分辨率

SD 1.5训练分辨率: 512x512

比例	分辨率	用途	显存需求
1:1	512x512	头像、图标	4GB
2:3	512x768	人像竖图	5GB
3:2	768x512	风景横图	5GB
9:16	512x896	手机壁纸	6GB
16:9	896x512	电脑壁纸	6GB
3:4	640x832	全身人像	6GB

SDXL训练分辨率: 1024x1024 (需要12GB+显存)

分辨率常见问题

问题1: 分辨率越高越好?

 错误!
- SD 1.5在512x512训练,直接生成1024x1024会:
  - 画面重复元素(如多个头、多只手)
  - 构图混乱
  - 细节崩坏

 正确做法:
1. 先512x768生成
2. 用高清修复(Hires.fix)放大到1024x1536

问题2: 非标准分辨率

常见错误分辨率:
- 500x700 (不是64的倍数)
- 1000x1000 (太大,且不是标准比例)

正确分辨率(必须是64的倍数):
- 512, 576, 640, 704, 768, 832, 896, 960, 1024...

WebUI会自动调整,但最好手动设置

不同内容的推荐分辨率

人像:

半身像: 512x768 (最常用)
全身像: 512x832 或 640x832
多人合照: 768x512 (横向)
特写头像: 640x640 或 512x512

风景:

自然风光: 768x512 (16:9接近)
城市街景: 896x512 (更宽)
竖版瀑布: 512x896

插画/二次元:

角色立绘: 512x768
CG壁纸: 768x512
头像: 512x512

高清修复(Hires.fix)

Hires.fix原理

两阶段生成:

阶段1: 先生成512x768的基础图
阶段2: 放大到1024x1536,同时重绘优化细节

优点: 避免高分辨率直接生成的构图问题
缺点: 时间翻倍(两次生成)

Hires.fix设置

在WebUI中启用:

1. 勾选 "Hires. fix"
2. Upscaler: 选择放大算法
3. Upscale by: 放大倍数(通常2.0)
4. Denoising strength: 重绘强度(0.4-0.7)

放大算法选择

Upscaler对比:

算法	速度	适用
Latent	最快	快速放大,轻微模糊
Latent (bicubic)		平衡选择
R-ESRGAN 4x+		写实人像,细节最好
R-ESRGAN 4x+ Anime6B		二次元专用
SwinIR 4x		质量极高,很慢

Denoising Strength(重绘强度)

0.0: 不重绘,仅放大(模糊)
0.3: 轻微优化,保持原图  保守选择
0.5: 平衡重绘,优化细节  推荐
0.7: 大幅重绘,可能改变画面 ⚠️ 谨慎使用
1.0: 完全重绘,几乎是新图

选择建议:

写实人像: 0.4-0.5 (保持面部特征)
风景: 0.5-0.6 (可以多优化)
二次元: 0.45-0.55 (平衡)
初次尝试: 0.5 (最保险)

Hires.fix完整配置示例

写实人像高清输出:

First pass:
- Size: 512x768
- Steps: 25
- Sampler: DPM++ 2M Karras
- CFG: 7

Hires. fix:
 Enable Hires. fix
- Upscaler: R-ESRGAN 4x+
- Upscale by: 2.0 (最终1024x1536)
- Hires steps: 15 (可以少于第一阶段)
- Denoising strength: 0.45

生成时间: 约25秒 (RTX 3060)

二次元壁纸:

First pass: 768x512
Upscaler: R-ESRGAN 4x+ Anime6B
Upscale by: 2.0 (最终1536x1024)
Denoising: 0.5

Seed(随机种子)

Seed的作用

种子 = 生成过程的起点随机数

Seed = -1:  每次随机,生成不同图片
Seed = 123456: 固定值,相同参数生成相同图片(可复现)

Seed使用场景

1. 探索阶段(-1随机):

目的: 测试提示词,寻找满意构图
设置: Seed = -1
批量生成: 4-8张,选最佳

2. 微调阶段(固定Seed):

目的: 固定构图,仅调整参数
步骤:
1. 找到满意图片,记下Seed(如 3847562)
2. 固定Seed = 3847562
3. 调整CFG、Steps、提示词权重
4. 对比哪个参数效果最好

3. 系列创作(Seed变化):

目的: 生成相似但不同的角色
方法: 固定提示词,Seed递增
Seed: 1001, 1002, 1003, 1004...
效果: 相同风格,不同姿态/表情

Variation Seed(变体种子)

生成相似图片:

在WebUI中:
1. 设置主Seed: 123456
2. 启用 Variation seed
3. Variation strength: 0.1-0.3

效果: 在原图基础上微调,95%相似,5%变化
用途: 生成同一角色的不同表情/角度

Seed管理技巧

记录优质Seed:

建议创建Excel表格:
| Seed | 模型 | 提示词 | 效果 | 日期 |
|------|------|--------|------|------|
| 3847562 | Realistic V5 | girl, smile | 完美微笑 | 2024-01 |
| 9182374 | Anything V5 | 1girl, blue hair | 构图好 | 2024-01 |

从PNG读取Seed:

方法1: PNG Info标签页
1. 拖入图片
2. 查看完整参数,包括Seed

方法2: 直接发送到txt2img
1. PNG Info中点击"Send to txt2img"
2. 所有参数自动填充

批量生成(Batch)

Batch Count vs Batch Size

Batch Count (批次数量):

串行生成,一张接一张
Batch Count = 4: 生成4次,每次1张
显存占用: 低
总时间: 4 x 单张时间
推荐: 显存不足时使用

Batch Size (批量大小):

并行生成,一次生成多张
Batch Size = 4: 一次生成4张
显存占用: 高(约4倍)
总时间: 约1.5 x 单张时间
推荐: 显存充足时使用(12GB+)

批量生成策略

6GB显存(GTX 1660):

Resolution: 512x768
Batch Size: 1
Batch Count: 8
效果: 串行生成8张,稳定不爆显存

12GB显存(RTX 3060):

Resolution: 512x768
Batch Size: 2
Batch Count: 4
效果: 2x4=8张,时间节省30%

24GB显存(RTX 4090):

Resolution: 512x768
Batch Size: 4-6
Batch Count: 2
效果: 并行生成,极速出图

参数组合推荐配置

配置1: 快速预览(测试提示词)

目标: 5-8秒出图,快速验证想法
Sampler: UniPC
Steps: 15
CFG Scale: 7
Resolution: 512x512
Hires.fix: 关闭
Batch Size: 1
Batch Count: 4
显存需求: 4GB
适合: 探索阶段,测试大量提示词

配置2: 日常创作(平衡)

目标: 10-15秒,质量满意
Sampler: DPM++ 2M Karras
Steps: 20
CFG Scale: 7
Resolution: 512x768
Hires.fix: 关闭
Batch Size: 1
Batch Count: 1
显存需求: 5GB
适合: 日常出图,性价比最高  最推荐

配置3: 高质量输出(写实人像)

目标: 极致质量,商用级别
Sampler: DPM++ SDE Karras
Steps: 28
CFG Scale: 6.5
Resolution: 512x768
Hires.fix: 启用
  - Upscaler: R-ESRGAN 4x+
  - Upscale by: 2.0
  - Denoising: 0.45
  - Hires steps: 20
Batch Size: 1
Batch Count: 1
显存需求: 8GB
生成时间: 25-30秒
适合: 精品创作,最终作品

配置4: 二次元插画

Sampler: Euler a
Steps: 28
CFG Scale: 6
Resolution: 512x768
Hires.fix: 启用
  - Upscaler: R-ESRGAN 4x+ Anime6B
  - Upscale by: 2.0
  - Denoising: 0.5
Model: Anything V5 / CounterfeitV3
显存需求: 7GB
适合: 高质量动漫角色

配置5: 批量探索(寻找最佳)

目标: 一次生成多张候选,挑选最佳
Sampler: DPM++ 2M Karras
Steps: 20
CFG Scale: 7
Resolution: 512x768
Batch Size: 2 (12GB显存) 或 1 (6GB显存)
Batch Count: 4
Seed: -1 (随机)
总输出: 8张
适合: 找满意构图

配置6: 风景壁纸

Sampler: DPM++ 2M Karras
Steps: 25
CFG Scale: 8
Resolution: 768x512 → Hires → 1536x1024
Hires.fix:
  - Upscaler: R-ESRGAN 4x+
  - Upscale by: 2.0
  - Denoising: 0.55
显存需求: 10GB
适合: 自然风光、城市景观

参数调优流程

标准优化流程(推荐)

Step 1: 快速验证提示词(2分钟)

Sampler: UniPC
Steps: 15
CFG: 7
Resolution: 512x512
Batch Count: 4
目的: 确认提示词是否正确,构图是否满意

Step 2: 提升质量生成(1分钟)

选择最佳构图的图片,记下Seed
固定Seed
Sampler: 改为 DPM++ 2M Karras
Steps: 改为 25
Resolution: 改为 512x768
目的: 在满意构图基础上提升质量

Step 3: 微调CFG(可选,2分钟)

固定Seed和其他参数
测试CFG: 6, 7, 8
对比选最佳

Step 4: 高清输出(1分钟)

启用Hires.fix
Upscaler: R-ESRGAN 4x+ (写实) 或 Anime6B (二次元)
Upscale by: 2.0
Denoising: 0.45
生成最终1024x1536高清图

总耗时: 约6-8分钟,产出完美作品

问题诊断与解决

问题1: 生成速度太慢

检查项:
1. Sampler是否用了DDIM/PLMS(换成DPM++ 2M)
2. Steps是否超过30(降到20-25)
3. 是否启用了xFormers(Settings > Performance)
4. 分辨率是否过大(先512x768,后Hires)

问题2: 画面过曝/过暗

过曝: CFG过高 → 降到6-7
过暗: CFG过低 → 升到8-9
或检查VAE是否正确加载

问题3: 画面模糊,细节不足

原因: Steps太低或Sampler不合适
解决:
1. Steps提升到25-28
2. 换Sampler为DPM++ SDE Karras
3. 启用Hires.fix

问题4: 构图重复(多个头/手)

原因: 分辨率超出模型训练范围
解决:
1. 降低初始分辨率到512x768
2. 用Hires.fix放大
3. 或在提示词中强调: 1girl (避免多人)

问题5: 风格不稳定,每次差异大

原因: Sampler随机性强(如Euler a)
解决:
1. 换成Euler或DPM++ 2M Karras
2. 固定Seed复现

显存优化技巧

低显存生存指南(4-6GB)

启动参数优化:

# webui-user.bat中添加
set COMMANDLINE_ARGS=--medvram --xformers --opt-split-attention

生成时设置:

Resolution: 不超过512x768
Batch Size: 1
关闭实时预览: Settings > Live previews > 关闭
Hires.fix: 谨慎使用,选Latent算法

其他优化:

1. 关闭浏览器其他标签页
2. 关闭占显存的软件(游戏、视频剪辑)
3. 重启WebUI释放显存碎片
4. 使用轻量化模型(pruned版本)

高显存充分利用(12GB+)

批量生成:

Batch Size: 2-4
Resolution: 768x768甚至1024x1024
Hires.fix: 随意开启

SDXL模型:

SDXL基础分辨率: 1024x1024
需要: 12GB+ 显存
优势: 质量远超SD 1.5