第7章：性能与存储调优

📖 章节概述

本章将深入讲解 MySQL 性能优化的核心技巧和实战经验，这是成为 MySQL 专家的关键技能。通过本章学习，你将掌握：

性能诊断：慢查询分析、性能监控、瓶颈定位
索引优化：索引设计原则、优化策略、常见误区
参数调优：Buffer Pool、I/O、连接、线程优化
架构优化：读写分离、分库分表、缓存策略
实战案例：电商系统、日志系统、高并发场景优化

🎯 学习目标

能够快速定位和解决MySQL性能问题
掌握索引优化的核心原则和最佳实践
了解不同场景下的调优策略和架构设计
具备生产环境性能优化的实战经验

🔍 一、性能诊断方法论

1️⃣ 性能优化的分层思维模型

性能优化是一个多层次的问题，不同瓶颈属于不同层。理解这个分层模型，能让我们快速定位问题根源：

┌─────────────────────────────┐
│   应用层（SQL逻辑 / 缓存策略） │ ← 改SQL、加缓存
├─────────────────────────────┤
│   数据库层（索引 / 执行计划） │ ← EXPLAIN / 调优索引
├─────────────────────────────┤
│   存储引擎层（InnoDB Buffer Pool / I/O） │ ← 参数调优 / 内存利用
├─────────────────────────────┤
│   操作系统层（CPU / 内存 / 网络 / 磁盘） │ ← sysstat / iostat 监控
└─────────────────────────────┘

优化思路： 先确定层，再逐层定位瓶颈，避免盲目调参。

2️⃣ 性能优化三步法

第一步：发现问题

慢查询日志分析
性能监控指标
用户反馈和业务指标

第二步：分析问题

EXPLAIN 执行计划分析
索引使用情况检查
锁等待和死锁分析

第三步：解决问题

SQL 语句优化
索引设计和优化
参数调优和架构调整

2️⃣ 慢查询诊断

开启慢查询日志：

-- 配置慢查询日志
SET GLOBAL slow_query_log = 'ON';
SET GLOBAL long_query_time = 1;  -- 超过1秒记录
SET GLOBAL log_queries_not_using_indexes = 'ON';

分析工具：

# 使用 pt-query-digest 分析（推荐）
pt-query-digest /var/lib/mysql/slow.log

# 使用 MySQL 自带工具
mysqldumpslow -s t /var/lib/mysql/slow.log | head -20

Performance Schema 实时监控：

-- 查看最耗时的SQL
SELECT 
    DIGEST_TEXT,
    COUNT_STAR AS exec_count,
    ROUND(SUM_TIMER_WAIT/1000000000000,2) AS total_time_s,
    ROUND((SUM_TIMER_WAIT/COUNT_STAR)/1000000000,2) AS avg_time_ms
FROM performance_schema.events_statements_summary_by_digest
ORDER BY total_time_s DESC
LIMIT 10;

📊 二、执行计划分析

1️⃣ EXPLAIN 关键字段解读

-- 分析执行计划
EXPLAIN SELECT * FROM users WHERE age > 30 AND city='Beijing';

-- 获取实际执行时间（MySQL 8.0+）
EXPLAIN ANALYZE SELECT * FROM users WHERE age > 30 AND city='Beijing';

关键字段说明：

字段	含义	优化目标
type	访问类型	尽量达到 ref 或 range
key	使用的索引	确保使用合适的索引
rows	预估扫描行数	减少扫描行数
Extra	额外信息	避免 Using filesort、Using temporary

type 字段性能排序：

system > const > eq_ref > ref > range > index > ALL

2️⃣ 常见性能问题识别

全表扫描（type=ALL）：

问题：没有合适的索引
解决：添加索引或优化查询条件

临时表排序（Using filesort）：

问题：ORDER BY 无法使用索引
解决：创建合适的索引或优化排序字段

临时表分组（Using temporary）：

问题：GROUP BY 无法使用索引
解决：优化分组字段或使用覆盖索引

🎯 三、索引优化核心法则

1️⃣ 索引设计原则

最左前缀原则：

-- 复合索引 (a, b, c)
WHERE a = 1              -- ✅ 使用索引
WHERE a = 1 AND b = 2    -- ✅ 使用索引  
WHERE b = 2              -- ❌ 不使用索引

覆盖索引优化：

-- 查询字段都在索引中，避免回表
CREATE INDEX idx_name_age ON users(name, age);
SELECT name, age FROM users WHERE name = 'Tom';  -- 覆盖索引

索引选择性：

-- 计算索引选择性
SELECT 
    COUNT(DISTINCT column_name) / COUNT(*) AS selectivity
FROM table_name;
-- 选择性 > 0.1 的列适合建索引

2️⃣ 常见索引失效场景

场景	示例	解决方案
函数操作	`WHERE UPPER(name) = 'TOM'`	改写为 `WHERE name = 'tom'`
隐式转换	`WHERE phone = 13800138000`	改为 `WHERE phone = '13800138000'`
前置通配符	`WHERE name LIKE '%tom'`	使用全文索引或ES
范围查询中断	`WHERE a=1 AND b>3 AND c=4`	调整索引顺序或使用ICP
OR 条件	`WHERE a=1 OR b=2`	拆分为 UNION 查询

3️⃣ 索引优化策略

避免索引失效：

不要在索引列上使用函数
避免隐式类型转换
避免使用 !=、<>、NOT IN
避免 LIKE '%abc%' 模式

优化分页查询：

-- 慢查询：OFFSET 扫描过多
SELECT * FROM users ORDER BY id LIMIT 100000, 10;

-- 优化：基于主键分页
SELECT * FROM users WHERE id > 100000 ORDER BY id LIMIT 10;

索引下推（ICP）：

-- MySQL 5.6+ 自动优化
EXPLAIN SELECT * FROM users WHERE name LIKE 'T%' AND age > 20;
-- 显示：Extra: Using index condition

⚙️ 四、参数调优

1️⃣ Buffer Pool 原理深度解析

Buffer Pool 工作机制： InnoDB 把磁盘页 (16KB) 缓存在 Buffer Pool 中。每次查询都会先查 Buffer Pool，再查磁盘：

        ┌──────────────────────────┐
        │        Buffer Pool        │
        │ ┌──────┐  ┌──────┐  ┌──────┐ │
        │ │ Page │→ │ Page │→ │ Page │ │
        │ └──────┘  └──────┘  └──────┘ │
        └──────────────────────────┘
                    │
             ┌────────────┐
             │   磁盘数据页 │
             └────────────┘

命中率高 → 查询快
命中率低 → 频繁I/O → 查询慢

关键命中率指标计算：

-- 计算 Buffer Pool 命中率
SELECT 
  (1 - (SUM(CASE WHEN VARIABLE_NAME='Innodb_buffer_pool_reads' 
                 THEN VARIABLE_VALUE END) /
        SUM(CASE WHEN VARIABLE_NAME='Innodb_buffer_pool_read_requests' 
                 THEN VARIABLE_VALUE END))) * 100 AS buffer_hit_rate
FROM performance_schema.global_status;

核心参数配置：

-- 查看 Buffer Pool 状态
SHOW ENGINE INNODB STATUS\G

-- 关键参数
innodb_buffer_pool_size = 8G          -- 设置为内存的70-80%
innodb_buffer_pool_instances = 8      -- 提高并发性能
innodb_io_capacity = 2000             -- SSD推荐值
innodb_flush_log_at_trx_commit = 2    -- 平衡性能与安全

调优策略：

大小设置：设置为系统内存的70-80%
实例数量：高并发场景使用8-16个实例
监控命中率：目标 ≥ 99%，如果低于95%说明内存配置不足或访问集中

2️⃣ 连接和线程优化

连接池配置：

max_connections = 2000        -- 最大连接数
wait_timeout = 600           -- 连接超时
thread_cache_size = 64       -- 线程缓存

线程优化：

innodb_thread_concurrency = 0    -- 工作线程数（0=自动）
innodb_read_io_threads = 4       -- 读线程数
innodb_write_io_threads = 4      -- 写线程数

3️⃣ 锁机制与性能的关系

InnoDB 的三类锁：

锁类型	作用	说明
行锁 (Row Lock)	精确锁定记录	基于索引
间隙锁 (Gap Lock)	防止幻读	范围内无记录也锁定
意向锁 (Intention Lock)	表级声明锁	提升并发安全性

性能影响关键点：

若 SQL 未使用索引 → 升级为表锁 → 性能急剧下降
若事务时间过长 → 锁持有时间延长 → 形成锁等待队列

查看锁等待：

-- 查看当前锁等待（MySQL 8.0+）
SELECT * FROM performance_schema.data_locks;
SELECT * FROM performance_schema.data_lock_waits;

-- 查看事务状态
SELECT * FROM information_schema.innodb_trx;

优化策略：

减少事务时间，避免长事务
降低锁粒度，使用行锁
避免热点行，分散更新操作
使用乐观锁，版本号控制

🏗️ 五、架构优化策略

1️⃣ 读写分离

架构设计：

应用层
├── 写操作 → 主库
└── 读操作 → 从库集群（多个）

实现方式：

应用层路由
中间件（MyCAT、ShardingSphere）
代理层（ProxySQL、MaxScale）

2️⃣ 分库分表

分片策略：

-- 水平分片示例
CREATE TABLE users_0 (
    id BIGINT AUTO_INCREMENT PRIMARY KEY,
    username VARCHAR(50),
    email VARCHAR(100),
    created_at TIMESTAMP,
    INDEX idx_username (username)
) ENGINE=InnoDB;

-- 分片规则：user_id % 16

分片原则：

避免跨分片查询
合理选择分片键
考虑数据倾斜问题
预留扩容空间

3️⃣ 缓存策略

多级缓存架构：

应用层缓存 → Redis集群 → 数据库

缓存策略：

Cache-Aside：应用控制缓存
Write-Through：写时更新缓存
Write-Behind：异步更新缓存

🎯 六、典型业务性能场景

1️⃣ 高并发写入优化

问题场景： 商品库存表每次下单都执行：

UPDATE goods SET stock = stock - 1 WHERE id = 100;

→ 高并发下行锁冲突严重

解决方案：

1. 分段库存表分散更新：

-- 按商品ID分片（id % 8）
CREATE TABLE goods_stock_0 (
    id BIGINT PRIMARY KEY,
    stock INT,
    version INT,
    updated_at TIMESTAMP
) ENGINE=InnoDB;

2. Redis 预扣库存（Lua原子操作）：

-- Lua脚本保证原子性
local stock = redis.call('GET', KEYS[1])
if tonumber(stock) >= tonumber(ARGV[1]) then
    return redis.call('DECRBY', KEYS[1], ARGV[1])
else
    return -1
end

3. 版本号控制乐观锁：

UPDATE goods 
SET stock = stock - 1, version = version + 1 
WHERE id = 100 AND version = @v;

2️⃣ 统计聚合优化

问题场景：

大表GROUP BY查询慢
实时统计需求高
数据量：10亿+记录

解决方案：

1. 预计算表：

-- 创建预计算统计表
CREATE TABLE daily_stats (
    stat_date DATE,
    user_count INT,
    order_count INT,
    total_amount DECIMAL(15,2),
    PRIMARY KEY (stat_date)
) ENGINE=InnoDB;

2. 增量更新：

-- 定时任务增量更新
INSERT INTO daily_stats (stat_date, user_count, order_count, total_amount)
SELECT 
    DATE(created_at) as stat_date,
    COUNT(DISTINCT user_id) as user_count,
    COUNT(*) as order_count,
    SUM(amount) as total_amount
FROM orders 
WHERE created_at >= CURDATE()
GROUP BY DATE(created_at)
ON DUPLICATE KEY UPDATE
    user_count = VALUES(user_count),
    order_count = VALUES(order_count),
    total_amount = VALUES(total_amount);

3️⃣ 长事务优化

问题场景：

批量数据处理事务过长
锁等待时间久
影响其他业务

解决方案：

1. 分批处理：

-- 分批处理大事务
SET @batch_size = 1000;
SET @offset = 0;

WHILE @offset < @total_count DO
    START TRANSACTION;
    
    UPDATE large_table 
    SET status = 'processed' 
    WHERE id BETWEEN @offset AND @offset + @batch_size - 1;
    
    COMMIT;
    SET @offset = @offset + @batch_size;
END WHILE;

2. 异步处理：

-- 使用消息队列异步处理
INSERT INTO task_queue (task_type, data, status) 
VALUES ('batch_update', @data, 'pending');

🎯 七、实战案例

1️⃣ 电商订单系统优化

问题场景：

订单表数据量：1亿+
查询QPS：10万+
写入TPS：5万+

优化方案：

1. 分库分表：

-- 按用户ID分片
CREATE TABLE orders_0 (
    id BIGINT AUTO_INCREMENT,
    user_id BIGINT,
    order_no VARCHAR(32),
    status TINYINT,
    amount DECIMAL(10,2),
    created_at TIMESTAMP,
    PRIMARY KEY (id, user_id),
    INDEX idx_user_time (user_id, created_at)
) ENGINE=InnoDB;

2. 索引优化：

-- 复合索引优化查询
CREATE INDEX idx_status_time ON orders(status, created_at);
CREATE INDEX idx_user_status ON orders(user_id, status);

3. 缓存策略：

用户订单列表：Redis缓存
订单详情：本地缓存 + Redis
库存信息：Redis + 数据库

2️⃣ 日志系统优化

问题场景：

日志表：10亿+记录
写入QPS：50万+
查询需求：按时间范围查询

优化方案：

1. 分区表：

CREATE TABLE access_logs (
    id BIGINT AUTO_INCREMENT,
    user_id INT,
    action VARCHAR(50),
    created_at DATETIME,
    PRIMARY KEY (id, created_at)
) PARTITION BY RANGE (YEAR(created_at)) (
    PARTITION p2024 VALUES LESS THAN (2025),
    PARTITION p2025 VALUES LESS THAN (2026)
);

2. 冷热数据分离：

热数据：SSD存储，实时查询
冷数据：归档到对象存储
温数据：压缩存储

📊 七、性能优化Checklist

1️⃣ SQL 优化 Checklist

在企业实战中，调优常常可通过以下清单完成 80% 的优化：

维度	检查项	工具 / 方法
SQL	WHERE 是否走索引？	EXPLAIN
索引	是否有重复或无用索引？	pt-index-usage
事务	是否存在长事务或锁等待？	information_schema.innodb_trx
Buffer Pool	命中率 > 95%？	performance_schema.global_status
I/O	IOPS 是否过高？	iostat / pmacct
慢查询	是否有长时间 SQL？	slow log / pt-query-digest
分页	OFFSET 是否过大？	改为主键分页
统计	是否存在大 GROUP BY？	预计算表或 Redis 聚合
架构	是否可缓存 / 分片 / 拆读写？	架构调整

2️⃣ 性能调优策略分级表

优化层级	目标	示例方案
Level 1	SQL 优化	EXPLAIN、覆盖索引
Level 2	参数优化	buffer_pool / io_capacity
Level 3	架构优化	主从读写分离
Level 4	系统优化	SSD / NUMA / OS cache
Level 5	业务架构优化	缓存层、消息队列、异步写入

3️⃣ 关键性能指标

数据库指标：

QPS：每秒查询数
TPS：每秒事务数
连接数：当前活跃连接
慢查询：执行时间超过阈值的查询

系统指标：

CPU使用率
内存使用率
磁盘I/O
网络I/O

4️⃣ 监控工具

MySQL自带工具：

-- 查看状态
SHOW STATUS;

-- 查看变量
SHOW VARIABLES;

-- 查看进程
SHOW PROCESSLIST;

第三方工具：

Prometheus + Grafana
Zabbix
Percona Monitoring and Management (PMM)

5️⃣ 调优效果验证

调优前后对比：

响应时间：平均响应时间降低
吞吐量：QPS/TPS提升
资源使用：CPU/内存使用率优化
用户体验：页面加载时间缩短

🎉 总结

性能优化的核心原则：

测量优先：先测量，再优化
索引为王：合理的索引设计是性能的基础
架构合理：根据业务特点选择合适的架构
持续监控：建立完善的监控体系
渐进优化：小步快跑，持续改进

🧭 优化不是调参数，而是理解系统的"瓶颈流向"：

CPU → 内存 → IO → 锁 → SQL → 架构

真正的 MySQL 调优专家，能从"一个慢SQL"看出整个系统的呼吸节奏。

记住：

没有银弹，只有合适的解决方案
性能优化是一个持续的过程
业务理解比技术更重要
优化是分层的，要逐层定位瓶颈
从"调参数"到"懂原理"，才能真正掌握调优

☁️ 八、云原生MySQL调优

1️⃣ 容器化MySQL优化

Docker配置优化：

# docker-compose.yml
version: '3.8'
services:
  mysql:
    image: mysql:8.0
    container_name: mysql-optimized
    environment:
      MYSQL_ROOT_PASSWORD: password
      MYSQL_DATABASE: testdb
    command: >
      --innodb_buffer_pool_size=2G
      --innodb_log_file_size=256M
      --max_connections=1000
      --innodb_flush_log_at_trx_commit=2
      --innodb_io_capacity=2000
    volumes:
      - mysql_data:/var/lib/mysql
      - ./my.cnf:/etc/mysql/conf.d/custom.cnf
    ports:
      - "3306:3306"
    deploy:
      resources:
        limits:
          memory: 4G
          cpus: '2.0'
        reservations:
          memory: 2G
          cpus: '1.0'
    healthcheck:
      test: ["CMD", "mysqladmin", "ping", "-h", "localhost"]
      timeout: 20s
      retries: 10

volumes:
  mysql_data:

Kubernetes配置优化：

# mysql-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: mysql-deployment
spec:
  replicas: 1
  selector:
    matchLabels:
      app: mysql
  template:
    metadata:
      labels:
        app: mysql
    spec:
      containers:
      - name: mysql
        image: mysql:8.0
        env:
        - name: MYSQL_ROOT_PASSWORD
          value: "password"
        resources:
          requests:
            memory: "2Gi"
            cpu: "1000m"
          limits:
            memory: "4Gi"
            cpu: "2000m"
        volumeMounts:
        - name: mysql-storage
          mountPath: /var/lib/mysql
        - name: mysql-config
          mountPath: /etc/mysql/conf.d
      volumes:
      - name: mysql-storage
        persistentVolumeClaim:
          claimName: mysql-pvc
      - name: mysql-config
        configMap:
          name: mysql-config

2️⃣ 云数据库优化策略

AWS RDS优化：

-- 参数组配置
-- 实例类：db.r5.2xlarge (8 vCPU, 64 GB RAM)
-- 存储：gp3 1000 GB, 3000 IOPS
-- 参数组：mysql8.0-optimized

-- 关键参数
innodb_buffer_pool_size = 48G
innodb_log_file_size = 1G
innodb_io_capacity = 3000
innodb_io_capacity_max = 6000
max_connections = 2000

阿里云RDS优化：

-- 实例规格：mysql.n2.4xlarge (16 vCPU, 64 GB RAM)
-- 存储：ESSD 1000 GB, 3000 IOPS
-- 参数模板：mysql8.0-high-performance

-- 关键参数
innodb_buffer_pool_size = 48G
innodb_log_file_size = 1G
innodb_io_capacity = 3000
innodb_io_capacity_max = 6000
max_connections = 2000

3️⃣ 微服务架构优化

读写分离配置：

# application.yml
spring:
  datasource:
    master:
      url: jdbc:mysql://master:3306/testdb
      username: root
      password: password
      driver-class-name: com.mysql.cj.jdbc.Driver
    slave:
      url: jdbc:mysql://slave:3306/testdb
      username: root
      password: password
      driver-class-name: com.mysql.cj.jdbc.Driver
  sharding:
    datasource:
      names: master,slave
      master:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://master:3306/testdb
        username: root
        password: password
        maximum-pool-size: 20
        minimum-idle: 5
      slave:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://slave:3306/testdb
        username: root
        password: password
        maximum-pool-size: 20
        minimum-idle: 5

连接池优化：

// HikariCP配置
@Configuration
public class DatabaseConfig {
    
    @Bean
    @ConfigurationProperties("spring.datasource.hikari")
    public HikariConfig hikariConfig() {
        HikariConfig config = new HikariConfig();
        config.setMaximumPoolSize(20);
        config.setMinimumIdle(5);
        config.setConnectionTimeout(30000);
        config.setIdleTimeout(600000);
        config.setMaxLifetime(1800000);
        config.setLeakDetectionThreshold(60000);
        return config;
    }
}

4️⃣ 性能测试方法

压力测试工具：

# sysbench测试
sysbench oltp_read_write \
  --mysql-host=localhost \
  --mysql-port=3306 \
  --mysql-user=root \
  --mysql-password=password \
  --mysql-db=testdb \
  --tables=10 \
  --table-size=1000000 \
  --threads=16 \
  --time=300 \
  --report-interval=10 \
  run

# tpcc测试
./tpcc_start -h localhost -P 3306 -d testdb -u root -p password -w 10 -c 16 -r 60 -l 300

监控指标：

-- 性能监控查询
SELECT 
    VARIABLE_NAME,
    VARIABLE_VALUE
FROM information_schema.GLOBAL_STATUS 
WHERE VARIABLE_NAME IN (
    'Questions',
    'Uptime',
    'Threads_connected',
    'Threads_running',
    'Innodb_buffer_pool_hit_rate',
    'Innodb_rows_read',
    'Innodb_rows_inserted',
    'Innodb_rows_updated',
    'Innodb_rows_deleted'
);

5️⃣ 云原生监控体系

Prometheus + Grafana监控：

# prometheus.yml
global:
  scrape_interval: 15s

scrape_configs:
  - job_name: 'mysql'
    static_configs:
      - targets: ['mysql-exporter:9104']
    scrape_interval: 5s
    metrics_path: /metrics

MySQL Exporter配置：

# mysql-exporter.yml
mysql:
  host: "localhost:3306"
  user: "exporter"
  password: "password"
  timeout: 5s
  tls_insecure_skip_verify: true

关键监控指标：

QPS/TPS
连接数
锁等待
慢查询
复制延迟
磁盘使用率