Mysql 幻读详解

我们来详细地聊一聊 MySQL InnoDB 中的“幻读”（Phantom Read）问题。这是一个在数据库事务隔离中非常核心且有时令人困惑的概念。

我会从定义、例子、原因以及解决方案几个方面来彻底讲清楚。

1. 什么是幻读？

官方定义：幻读指的是在一个事务内，相同的查询在不同时间执行，返回了不同数量的行。

这听起来和“不可重复读”很像，但它们有关键区别：

不可重复读 (Non-Repeatable Read)：侧重于同一行的数据内容被修改或删除。（例如：你第二次查询时，某行的薪水从10000变成了12000）。
幻读 (Phantom Read)：侧重于新的行被插入（或删除），导致结果集的行数发生了变化。（针对结果集的数量变化，例如：你第一次查询有10条记录，第二次查询却冒出了11条）。

简单比喻：

不可重复读：你碗里的一块红烧肉被别人咬了一口（数据内容变了）。
幻读：你正准备夹碗里最后一块红烧肉时，别人突然又往碗里加了一块新的肉（数据行数变了）。

2. 幻读发生的场景与例子

幻读发生的根本原因是：在“可重复读（REPEATABLE READ）”及以下隔离级别中，普通的一致性读（快照读）无法阻止其他事务插入新的、满足当前查询条件的数据。

我们来看一个经典的例子。

表结构：

CREATE TABLE `employee` (`id` int(11) NOT NULL AUTO_INCREMENT,`name` varchar(50) NOT NULL,`salary` int(11) DEFAULT NULL,PRIMARY KEY (`id`),KEY `idx_salary` (`salary`)
) ENGINE=InnoDB;INSERT INTO `employee` (`name`, `salary`) VALUES
('Alice', 8000),
('Bob', 9000),
('Charlie', 10000);

时间线：

时间	事务A (隔离级别：RR)	事务B
T1	`START TRANSACTION;`
T2	`SELECT * FROM employee WHERE salary > 8000;` 结果： Bob, 9000 Charlie, 10000 (2 rows)	`START TRANSACTION;`
T3		`INSERT INTO employee (name, salary) VALUES ('David', 9500);` `COMMIT;` <!-- 事务B提交 -->
T4	`SELECT * FROM employee WHERE salary > 8000;` 结果： Bob, 9000 Charlie, 10000 (仍然是2 rows！) （这里没有幻读，因为RR级别通过MVCC提供了快照）
T5	`UPDATE employee SET salary = 8888 WHERE salary > 8000;` （注意：这个更新操作是当前读，会看到事务B已提交的修改）
T6	`SELECT * FROM employee WHERE salary > 8000;` 结果： Bob, 8888 Charlie, 8888 David, 8888 (3 rows! 幻读出现了！)

例子分析：

T2时刻：事务A第一次查询，得到2条记录。
T4时刻：事务A第二次普通查询（快照读）。由于InnoDB的MVCC（多版本并发控制）机制，它会读取事务开始时的数据快照，所以看不到事务B新插入的 David(9500)。此时还没有幻读。
T5时刻：关键点来了！事务A执行了一个UPDATE操作。UPDATE/DELETE/INSERT 这类写操作会使用“当前读”（Current Read），它会读取数据库中最新的、已提交的数据。因此，它看到了事务B插入的 David(9500) 这条记录，并将其薪水也更新为8888。
T6时刻：事务A再次查询。因为之前的UPDATE操作属于当前事务的修改，所以MVCC规则允许它看到自己的修改。于是，它神奇地看到了三条记录！幻读就在这一刻发生了。

这个例子展示了InnoDB中幻读最典型的特征：即使是在默认的RR隔离级别下，先快照读，再当前读进行写操作，可能会意外地影响新插入的行，从而导致数据不一致。

3. 解决方案：Next-Key Lock 锁机制

InnoDB引擎为了解决幻读问题，在“可重复读（REPEATABLE READ）”隔离级别下就引入了一种叫做 Next-Key Lock 的锁机制。它实际上是 记录锁（Record Lock） 和 间隙锁（Gap Lock） 的结合。

记录锁 (Record Lock)：锁住索引上的某一条具体记录。
间隙锁 (Gap Lock)：锁住索引记录之间的“间隙”，防止在这个间隙内插入新的数据。它是一个左开右开的区间 (a, b)。
临键锁 (Next-Key Lock)：是记录锁 + 间隙锁的结合。它锁住一条记录和它前面的间隙。它是一个左开右闭的区间 (a, b]。

如何解决幻读？

在上面的例子中，如果事务A在第一次查询时，就对 salary > 8000 这个条件加上了锁，那么事务B的插入操作就会被阻塞，从而杜绝幻读。

让我们重演时间线，但这次事务A加锁查询：

时间	事务A (加锁查询)	事务B
T1	`START TRANSACTION;`
T2	`SELECT * FROM employee WHERE salary > 8000 FOR UPDATE;` （FOR UPDATE 会给查询结果加Next-Key Lock）结果：2 rows	`START TRANSACTION;`
T3		`INSERT INTO employee (name, salary) VALUES ('David', 9500);` （这条语句会被阻塞，一直等待事务A释放锁！）
T4	`SELECT ... FOR UPDATE;` （再次查询，结果一致）	...（阻塞中）...
T5	`COMMIT;` （提交事务，释放锁）	...（阻塞结束）...
T6		（此时事务B才能成功插入）

发生了什么？

当事务A执行 SELECT ... FOR UPDATE 时，InnoDB会为其加Next-Key Lock。假设 salary 上有二级索引 idx_salary，它可能会锁住以下区间：

锁住 (8000, 9000] 这个Next-Key Lock（锁住9000这条记录和它前面的间隙）。
锁住 (9000, 10000] 这个Next-Key Lock（锁住10000这条记录和它前面的间隙）。
锁住 (10000, +∞] 这个Next-Key Lock（锁住正无穷的上界）。

事务B试图插入 salary = 9500 的记录，这个值落在被事务A锁住的 (9000, 10000] 间隙内，因此插入操作会被阻塞，直到事务A提交释放锁。这样就彻底防止了幻读的发生。

总结与最佳实践

特性	说明
幻读本质	同一事务内，两次查询结果集行数不一致， due to 其他事务的插入或删除操作。
InnoDB的默认防御	在REPEATABLE READ隔离级别下，InnoDB通过 Next-Key Lock 机制来防止幻读。
何时会发生幻读	即使是在RR级别下，如果你只是进行普通的快照读（SELECT），然后基于此进行当前读的写操作（UPDATE/INSERT/DELETE），仍然可能遇到幻读。快照读不加锁是根源。
彻底解决方法	在需要绝对保证数据一致性的关键操作中，使用加锁读： 1. `SELECT ... FOR UPDATE;` （加写锁，阻塞其他事务的写和加锁读） 2. `SELECT ... LOCK IN SHARE MODE;` （加读锁，阻塞其他事务的写）这些语句会在符合条件的索引上加Next-Key Lock，从而阻止其他事务在锁定区间内插入新数据。
终极方案	将事务隔离级别提升至 SERIALIZABLE。在这个级别下，所有的读操作都会默认加上类似 `LOCK IN SHARE MODE` 的锁，幻读自然不会发生，但这是以牺牲并发性能为代价的，一般不建议使用。

核心要点：MySQL InnoDB 在 RR 级别下已经通过 Next-Key Lock 很大程度上解决了幻读问题。但你需要清楚地知道，只有在你的查询语句确实需要加锁（例如使用了 FOR UPDATE）或者涉及写操作时，Next-Key Lock 才会生效。单纯的快照读是无法完全避免幻读的潜在影响的。

推荐一个非常好用的工具集合：在线工具集合 - 您的开发助手

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/96314.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/96314.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！