HiHuo
首页
博客
手册
工具
关于
首页
博客
手册
工具
关于
  • Stable Diffusion 完整实战

    • Stable Diffusion完全教程 - AI绘画从入门到精通 (2024最新)
    • 第一章: Stable Diffusion安装部署
    • 第二章: Stable Diffusion模型详解
    • 第三章: Stable Diffusion提示词技巧
    • 第四章: Stable Diffusion参数调优
    • 第五章: ControlNet精准控制
    • 第六章: Stable Diffusion实战案例

第二章: Stable Diffusion模型详解

模型类型全解析

模型分类总览

SD模型体系
├── Checkpoint (大模型,2-7GB)
│   ├── 底模(Base Model)
│   ├── 真实系
│   ├── 二次元
│   └── 艺术风格
├── LoRA (小模型,10-200MB)  
│   ├── 人物LoRA
│   ├── 风格LoRA
│   └── 概念LoRA
├── VAE (色彩优化,300MB)
├── Embedding/Textual Inversion (关键词,10-100KB)
├── Hypernetwork (风格网络,50-200MB)
└── ControlNet (控制模型,1-2GB)

1. Checkpoint(大模型)

什么是Checkpoint?

Checkpoint是SD的核心大模型,决定了整体画风和质量。

特点:

  • 文件大小: 2-7GB
  • 格式: .safetensors(推荐) 或 .ckpt
  • 作用: 定义基础画风
  • 同时只能用1个

主流Checkpoint推荐

真实系(Realistic)

1. Realistic Vision V5.1

  • 大小: 2GB
  • 特点: 超写实,亚洲面孔友好
  • 擅长: 人像摄影,时尚大片
  • 推荐CFG: 4-7
  • 适合人群: 想做写实人像

示例Prompt:

a beautiful asian girl, long black hair, natural makeup,
professional photography, soft lighting, 8k uhd, film grain,
shot on Canon EOS R5, 85mm f1.2

2. ChilloutMix

  • 特点: 韩系美女,细节丰富
  • 擅长: 时尚写真,商业摄影
  • 注意: 需搭配VAE使用

3. Deliberate

  • 特点: 平衡写实与艺术
  • 擅长: 商业插画,概念设计
  • 通用性:

二次元(Anime)

1. Anything V5

  • 特点: 万用二次元,质量高
  • 擅长: 动漫角色,CG插画
  • 推荐给: 二次元爱好者

示例Prompt:

1girl, blue eyes, long silver hair, school uniform,
smile, cherry blossoms background,
anime style, highly detailed, vibrant colors

2. CounterfeitV3

  • 特点: 色彩鲜艳,日系风格
  • 擅长: 轻小说插画,漫画风

3. GhostMix

  • 特点: 幽灵系,神秘风格
  • 擅长: 奇幻角色,暗黑系

艺术风格

1. DreamShaper

  • 特点: 梦幻风格,创意丰富
  • 擅长: 概念艺术,场景设计
  • 通用性强

2. Protogen

  • 特点: 科幻机甲风格
  • 擅长: 游戏设计,赛博朋克

3. ReV Animated

  • 特点: 3D渲染风格
  • 擅长: 产品设计,建筑可视化

Checkpoint版本说明

文件名解读:

realisticVision_v51.safetensors
├─ 模型名: realisticVision
├─ 版本: v5.1
└─ 格式: safetensors

模型名_版本_剪枝类型.格式
如: anythingV5_v5_pruned-fp16.safetensors
     └─ pruned: 剪枝(减小文件)
     └─ fp16: 半精度(更小,质量略降)

版本选择:

  • 最新版: 通常质量更好
  • 稳定版: 标注"stable"的版本
  • 剪枝版(pruned): 文件小,质量接近
  • fp16版: 显存不足时选择

Checkpoint切换

1. 下载模型 → models/Stable-diffusion/
2. WebUI顶部 Checkpoint 下拉框
3. 选择模型(会重新加载,等10-30秒)
4. 生成图片测试

切换速度优化:

  • 使用SSD存放模型
  • 设置中启用"Accelerate model loading"

2. LoRA模型

什么是LoRA?

LoRA(Low-Rank Adaptation)是轻量级的风格/人物模型,可以叠加在Checkpoint上使用。

特点:

  • 文件大小: 10-200MB
  • 可以同时使用多个LoRA(建议≤3个)
  • 通过权重控制强度(0-1)
  • 灵活性极高

LoRA类型

1. 人物LoRA

用途: 生成特定人物/角色

示例:

<lora:柳岩:0.8>
1girl, black hair, red dress, smile

权重0.8 = 80%相似度
权重越高,越像目标人物
推荐范围: 0.6-0.9

2. 风格LoRA

用途: 改变画风

常见风格:

  • 中国风(古风)
  • 赛博朋克
  • 水墨画
  • 油画质感
  • 像素艺术

示例:

<lora:GuFeng_v2:0.7>
ancient chinese style, hanfu dress,
traditional architecture, ink painting

适合中国风主题

3. 概念LoRA

用途: 特定概念/场景

类型:

  • 光影效果(体积光、逆光)
  • 特定姿势(坐姿、背影)
  • 服装类型(婚纱、JK制服)
  • 场景类型(室内、森林)

LoRA使用方法

方法1: 直接写在Prompt

Prompt:
<lora:koreanDollLikeness_v15:0.7>
<lora:filmGrain_v1:0.5>
a beautiful girl, smile...

方法2: 从生成参数添加

1. 点击"生成参数"下方的🎴图标
2. 选择LoRA模型
3. 调整权重滑块
4. 自动添加到Prompt

LoRA权重调节

权重效果适用场景
0.3-0.5轻微影响仅作点缀
0.6-0.8明显效果推荐范围
0.9-1.0强烈影响可能过拟合
>1.0过度强化一般不推荐

LoRA叠加技巧

# 组合示例: 韩系美女
<lora:koreanDollLikeness:0.7>    # 韩系面孔
<lora:filmGrain:0.4>             # 胶片颗粒
<lora:detailTweaker:0.5>         # 细节增强

a korean girl, natural makeup,
soft lighting, professional photography

注意:
- LoRA数量: 建议≤3个
- 总权重: 建议<2.5
- 避免冲突: 不要用2个相同类型LoRA

3. VAE模型

什么是VAE?

VAE(Variational AutoEncoder)负责色彩和细节优化,可以显著改善画质。

作用:

  • 修正色彩偏灰/偏暗
  • 提升细节清晰度
  • 优化饱和度

对比:

无VAE: 色彩偏灰,发暗,细节模糊
有VAE: 色彩鲜艳,通透,细节锐利

推荐VAE

1. vae-ft-mse-840000-ema-pruned

  • 最常用,通用性强
  • 大小: 330MB
  • 适配: 大部分模型

2. kl-f8-anime2

  • 专门针对二次元
  • 色彩更鲜艳

3. Anything VAE

  • 搭配Anything系列模型

VAE使用

设置方法:

方法1: 全局设置
Settings > VAE > SD VAE > 选择VAE
Apply settings > Reload UI

方法2: 单次使用
生成参数下方 > VAE下拉框 > 选择

方法3: 自动匹配
将VAE命名为: 模型名.vae.safetensors
放在同一目录,自动加载
如: realisticVision_v51.vae.safetensors

是否需要VAE?

  • 有些模型内置VAE(baked VAE),不需要额外加载
  • 如果生成图片颜色正常,可以不用
  • 色彩偏灰、发暗,必须用

4. Embedding/Textual Inversion

什么是Embedding?

Embedding是将复杂概念压缩成一个关键词。

特点:

  • 文件极小: 10-100KB
  • 使用简单: 直接当关键词用
  • 类型: 正向(风格)、反向(排除问题)

常用Embedding

正向Embedding(风格)

示例:

easynegative, badhandv4, ng_deepnegative_v1_75t

使用:
Negative Prompt: easynegative, badhandv4, ...

反向Embedding(排除问题)

最常用: EasyNegative

  • 作用: 一键排除低质量、畸形、模糊等问题
  • 用法: 放在Negative Prompt第一个
  • 效果: 等同于写一长串反向词

对比:

不用EasyNegative:
Negative: (worst quality:2), (low quality:2), lowres, 
bad anatomy, bad hands, text, error, missing fingers,
extra digit, fewer digits, cropped, worst quality,
low quality, normal quality, jpeg artifacts, signature,
watermark, username, blurry
(需要记住一大堆)

用EasyNegative:
Negative: easynegative
(一个词搞定)

Embedding安装

1. 下载 .pt 或 .safetensors 文件
2. 放入: embeddings/
3. 刷新WebUI(不需要重启)
4. 直接在Prompt/Negative Prompt使用

5. Hypernetwork

什么是Hypernetwork?

Hypernetwork是另一种风格微调方式,类似LoRA但使用较少。

对比LoRA:

  • LoRA: 更灵活,效果更好,主流选择
  • Hypernetwork: 较老技术,逐渐被LoRA取代

使用场景: 少数特定老模型需要

6. ControlNet模型

什么是ControlNet?

ControlNet提供精准控制能力:

  • 控制姿势
  • 控制构图
  • 线稿上色
  • 深度控制
  • 边缘检测

详细内容见第5章

ControlNet模型类型

controlnet/
├── control_canny (边缘检测)
├── control_depth (深度图)
├── control_openpose (姿态控制)
├── control_scribble (涂鸦)
├── control_lineart (线稿)
└── control_tile (超分)

模型组合策略

组合公式

Checkpoint + LoRA(≤3) + VAE + Embedding = 最终效果

示例1: 韩系写真
Checkpoint: ChilloutMix
LoRA: koreanDollLikeness (0.7)
LoRA: filmGrain (0.4)
VAE: vae-ft-mse-840000
Negative: easynegative

示例2: 二次元插画
Checkpoint: Anything V5
LoRA: GuFeng_v2 (0.6) # 古风
VAE: kl-f8-anime2
Negative: easynegative

选择原则

  1. 明确目标: 想要什么风格?
  2. 选Checkpoint: 定基调(写实/二次元/艺术)
  3. 加LoRA微调: 调整细节风格
  4. 配VAE: 优化色彩
  5. 用Embedding: 排除问题

模型下载与管理

下载渠道

1. Civitai (最全,需翻墙)

  • https://civitai.com
  • 模型最多,更新最快
  • 有预览图和参数

2. LiblibAI (国内)

  • https://www.liblib.art
  • 访问快,无需翻墙
  • 中文界面

3. HuggingFace

  • https://huggingface.co
  • 官方模型源
  • 适合下载基础模型

下载建议

1. 看预览图: 是否是你想要的风格
2. 看评分: 4星以上
3. 看下载量: 下载多说明受欢迎
4. 看更新时间: 太老的模型可能过时
5. 看示例参数: 有参考价值

模型管理工具

Civitai Helper插件:

功能:
- 一键下载模型到正确目录
- 查看模型信息和预览图
- 管理本地模型
- 检查模型更新

安装:
Extensions > Install from URL
URL: https://github.com/butaixianran/Stable-Diffusion-Webui-Civitai-Helper

模型命名规范

推荐命名格式:
类型_名称_版本.格式

示例:
ckpt_realisticVision_v51.safetensors
lora_koreanDoll_v15.safetensors
vae_mse840k.safetensors

好处:
- 一眼看出类型
- 方便搜索
- 易于管理

模型训练(进阶)

训练LoRA

为什么训练?

  • 生成特定人物/角色
  • 创建自己的风格
  • 复现特定概念

训练所需:

  • 16GB+ 显存(推荐RTX 3090/4090)
  • 10-30张训练图片
  • 训练工具: Kohya_ss / Easy Training

简要流程:

1. 准备数据集(10-30张高质量图片)
2. 图片预处理(裁剪、打标签)
3. 配置训练参数
4. 训练(1-3小时)
5. 测试LoRA
6. 调整参数重新训练

详细训练教程超出本章范围,建议搜索专门教程

模型安全与版权

模型安全

safetensors vs ckpt:

  • .safetensors: 安全格式,推荐
  • .ckpt: 可能含恶意代码,谨慎使用

下载注意:

  • 只从可信站点下载
  • 下载前看评论和评分
  • 杀毒软件扫描

版权问题

训练数据版权:

  • 商用需注意版权
  • 人物肖像权问题
  • 艺术家风格版权

生成图片版权:

  • 个人使用:基本没问题
  • 商业使用:需谨慎,咨询律师
  • 不要生成侵权内容

常见问题

为什么我的图片颜色发灰? A: 没有使用VAE,加载一个VAE即可

LoRA不生效怎么办? A:

  1. 检查语法: <lora:名称:权重>
  2. 检查LoRA是否在models/Lora目录
  3. 刷新WebUI
  4. 增加权重到0.8-1.0

可以同时用多个Checkpoint吗? A: 不可以,同时只能用1个Checkpoint,但可以用多个LoRA

模型太多,WebUI加载很慢怎么办? A:

  1. 删除不常用的模型
  2. 使用SSD硬盘
  3. 启用模型哈希缓存

如何知道一个模型好不好? A:

  1. 看Civitai评分和评论
  2. 下载量高的通常不错
  3. 自己生成测试

推荐模型组合(新手)

组合1: 写实人像

Checkpoint: Realistic Vision V5.1
LoRA: detailTweaker (0.5)
VAE: vae-ft-mse-840000
Negative: easynegative

组合2: 二次元角色

Checkpoint: Anything V5
LoRA: 无(新手先不用)
VAE: kl-f8-anime2
Negative: easynegative

组合3: 通用创作

Checkpoint: DreamShaper
LoRA: 根据需要选择
VAE: vae-ft-mse-840000
Negative: easynegative

下一章预告

第三章: 提示词技巧

  • 500+风格关键词库
  • 提示词语法与权重
  • 正向/反向提示词技巧
  • 20个万能提示词模板

学会了选模型,下一步就是写好提示词!

Prev
第一章: Stable Diffusion安装部署
Next
第三章: Stable Diffusion提示词技巧