MySQL索引使用的数据结构

MySQL索引主要使用B+树（B+ Tree）作为默认的数据结构，同时在特定场景下也会使用哈希索引。下面我将详细解释这些数据结构及其在MySQL中的应用。

1. B+树（B+ Tree）

B+树是MySQL索引中最常用的数据结构，尤其是InnoDB存储引擎的默认索引结构。

B+树的结构特点

多路平衡搜索树：每个节点可以拥有多个子节点，远多于二叉树的两个子节点
所有数据存储在叶子节点：非叶子节点只存储键值和指针，不存储实际数据
叶子节点形成双向链表：所有叶子节点通过指针连接，便于范围查询和排序
高度平衡：所有叶子节点位于同一层级，保证查询效率稳定

--- title: B+树结构示意图 --- graph TD A["根节点 键值+指针"] --> B["非叶子节点 键值+指针"] A --> C["非叶子节点 键值+指针"] B --> D["叶子节点 键值+数据"] B --> E["叶子节点 键值+数据"] C --> F["叶子节点 键值+数据"] C --> G["叶子节点 键值+数据"] D <--> E E <--> F F <--> G style D fill:#f9f,stroke:#333,stroke-width:2px style E fill:#f9f,stroke:#333,stroke-width:2px style F fill:#f9f,stroke:#333,stroke-width:2px style G fill:#f9f,stroke:#333,stroke-width:2px

为什么MySQL选择B+树

减少磁盘I/O操作：
- B+树的高度通常很低（3-4层即可存储大量数据）
- 每个节点可以存储多个键值，减少磁盘访问次数
适合范围查询：
- 叶子节点形成有序链表，范围查询效率高
- 例如：WHERE id BETWEEN 100 AND 200 只需定位到起始点，然后遍历链表
查询效率稳定：
- 所有数据都在叶子节点，查询时间复杂度稳定在O(log n)
- 不会因为数据量增加而导致性能急剧下降
充分利用磁盘预读：
- 节点大小通常设置为磁盘页的倍数（如16KB）
- 一次I/O可以加载多个键值，提高空间局部性

2. 哈希索引

除了B+树，MySQL在某些场景下也使用哈希索引：

Memory存储引擎：默认使用哈希索引
InnoDB自适应哈希索引：InnoDB会自动对频繁访问的索引页建立哈希索引

哈希索引的特点

等值查询高效：时间复杂度接近O(1)
不支持范围查询：哈希表是无序的，无法进行范围查找
不支持排序：同样因为无序特性
哈希冲突问题：需要处理冲突，可能影响性能

3. 不同索引类型的数据结构

索引类型	存储引擎	主要数据结构	适用场景
B+树索引	InnoDB, MyISAM	B+树	大多数场景，特别是范围查询
哈希索引	Memory, InnoDB(自适应)	哈希表	等值查询频繁的场景
全文索引	InnoDB, MyISAM	倒排索引	文本搜索
空间索引	MyISAM	R树	地理空间数据

4. B+树与其他数据结构的比较

--- title: B+树与其他数据结构比较 --- erDiagram B+树 ||--o{ 数据 : "存储在叶子节点" 二叉树 ||--o{ 数据 : "每个节点都存储数据" 哈希表 ||--o{ 数据 : "通过哈希函数映射" B+树 { string 查询效率 "O(log n)" string 范围查询 "优秀" string 磁盘I/O "较少" string 插入删除 "较慢" } 二叉树 { string 查询效率 "O(log n)" string 范围查询 "一般" string 磁盘I/O "较多" string 插入删除 "较快" } 哈希表 { string 查询效率 "O(1)" string 范围查询 "不支持" string 磁盘I/O "不定" string 插入删除 "快" }

B+树 vs 二叉树

B+树优势：节点更多，树高更低，减少磁盘I/O
二叉树劣势：树高较高，查询时磁盘I/O次数多

B+树 vs 哈希表

B+树优势：支持范围查询和排序，适合大多数数据库场景
哈希表优势：等值查询更快，但不适合范围查询

B+树 vs B树

B+树优势：所有数据在叶子节点，查询更稳定；叶子节点链表便于范围查询
B树优势：部分数据在非叶子节点，某些查询可能更快

5. B+树索引的优缺点

优点

查询效率高：时间复杂度为O(log n)，且非常稳定
适合范围查询：叶子节点的链表结构使范围查询非常高效
减少磁盘I/O：树高较低，每个节点存储多个键值
充分利用预读：节点大小与磁盘页匹配，提高I/O效率

缺点

插入删除成本较高：可能需要节点分裂和合并
占用空间较大：需要存储额外的指针信息
不适合等值查询极频繁的场景：相比哈希索引，等值查询稍慢

6. 实际应用建议

合理选择索引字段：选择区分度高、经常用于查询条件的字段
避免过度索引：索引会增加写操作成本，占用存储空间
使用复合索引优化查询：对于多条件查询，使用复合索引可以减少索引数量
定期维护索引：使用ANALYZE TABLE更新索引统计信息，优化查询计划

总结来说，MySQL索引主要使用B+树数据结构，这是由数据库的查询特性和磁盘存储特点决定的。B+树在减少磁盘I/O、支持范围查询等方面具有明显优势，非常适合作为数据库索引的数据结构。

account_tree

思维导图

Interview AiBoxInterview AiBox — 面试搭档

不只是准备，更是实时陪练

Interview AiBox 在面试过程中提供实时屏幕提示、AI 模拟面试和智能复盘，让你每一次回答都更有信心。

免费下载 Interview AiBoxdownload 查看价格方案sell

AI 助读

一键发送到常用 AI

MySQL索引主要使用B+树（B+ Tree）作为默认数据结构，特定场景下也使用哈希索引。B+树是一种多路平衡搜索树，具有所有数据存储在叶子节点、叶子节点形成双向链表、高度平衡等特点。MySQL选择B+树主要是因为它能减少磁盘I/O操作、适合范围查询、查询效率稳定且能充分利用磁盘预读特性。与二叉树相比，B+树树高更低；与哈希表相比，B+树支持范围查询和排序。B+树索引查询效率高且适合范围查询，但插入删除成本较高。在实际应用中，应合理选择索引字段，避免过度索引，并定期维护索引。

智能总结

深度解读

考点定位

思路启发