MYSQL事务机制
在数据库管理系统中,事务是一个核心概念,它确保了数据的完整性和一致性。事务 是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
一、事务的引入
在许多业务功能实现过程,我们通常需要处理数据库中的多个对象或多个表,我们期望保证这一系列操作的原子性,否则处理过程的单个步骤的实现就会污染数据。比如下面这个例子:
用户A给用户B银行账户转账,金额3000,会分为如下步骤实现:
1、A银行卡余额扣除3000;
2、B银行卡余额增加3000。
如果在1执行完毕后系统故障,2未得到执行,就会导致A扣款成功了B未接收到的情况。
这显然不符合我们的预期。我们希望转账本身是一个原子事件,转账成功A-B+,不成功就都不变。事务引入帮我们解决了这个问题,在声明一组操作为事务后,这些操作要么同时成功,要么同时失败。只有提交了事务,整体操作才会生效,若部分操作由于某些原因执行失败导致事务未提交,则会回滚事务回到操作前状态。
二、事务的四大特性
事务是数据库操作的逻辑单位,具有以下四个基本特性,通常称为ACID特性:
原子性(Atomicity):
事务中的所有操作要么全部完成,要么全部不完成,不会结束在中间某个点。
当事务发现有些语句不能执行时,需要将数据恢复到事务执行前,通过undo log实现。
undo log是mysql中比较重要的事务日志之一,顾名思义,undo log是一种用于撤销回退的日志,
在事务没提交之前,MySQL会先记录更新前的数据到 undo log日志文件里面,
当事务回滚时或者数据库崩溃时,可以利用 undo log来进行回退。
持久性(Durability):
一旦事务提交,则其所做的修改会永久保存在数据库中,即使系统发生故障也不会丢失。
持久性问题的产生:
背景:Mysql为了保证存储效率,每次读写文件都是先对缓存池(Buffer Pool)操作,
缓冲池再定期刷新到磁盘中(这一过程称为刷脏)。
产生:由于数据不是直接写到磁盘,那么如果主机断电,就会有一部分数据丢失。
解决:通过重做日志(redo log)恢复数据。在每次修改数据之前,
都会将相应的语句写到redo log中,如果主机断电,那么再次启动时可通过redo log回复。
拓展:redo log也需要在事务提交时将日志写入磁盘,它比缓冲池写入快的原因有两点:
redo log是追加文件写,属于顺序IO,缓冲池是属于随机IO,且刷脏是以页为单位,
有一点修改就要整页写入。
一致性(Consistency):
事务必须使数据库从一个一致性状态变换到另一个一致性状态。
前面提到的原子性、持久性和隔离性,都是为了保证数据库状态的一致性。
隔离性(Isolation):
事务的执行不会被其他事务干扰,即一个事务内部的操作及使用的数据对并发的其他事务是隔离的。
与原子性、持久性侧重于研究事务本身不同,隔离性研究的是不同事务之间的相互影响。
下边讲到的事务并发问题就是隔离性的问题,MVCC就是解决这些问题的。
三、事务的使用
1、开启事务
START TRANSACTION;
执行业务SQL...
2、创建保存点
SAVEPOINT sp1; -- 可选
3、提交/回滚事务
ROLLBACK TO sp1; -- 回滚到保存点,保留之前的操作
ROLLBACK; -- 回滚到最开始
COMMIT;
4、以上123可为一个完整的事务应用过程,另外事务可以有两种提交方式:
-- 查看事务提交方式:
-- 方法一:
show variables like 'autocommit';
-- 方法二:
SELECT @@autocommit ;
-- 修改事务提交方式:
-- 设置手动提交:
SET autocommit = 0;
-- 设置自动提交:
SET autocommit = 1;
四、并发事务问题
1、脏读:
一个事务读到另外一个事务还没有提交的数据。
2、不可重复读:
一个事务先后读取同一条记录,但两次读取的数据不同,称之为不可重复读。
指的是存在其他并发事务在当前事务读取数据后修改了该数据,当前事务再次读取该数据,发现前后不一致。
3、幻读:
一个事务两次或多次读取同一个数据集的时候,读取到的数据数量不一致;
指的是在一个事务中,多次查询同一个范围的数据,却发现有新增或者减少的行。这是因为在这个事务进行的过程中,另一个事务插入或者删除了符合查询条件的数据,导致前后两次查询结果不一致。
五、事务隔离级别
数据库中,为了保证事务执行过程中尽量不受干扰,就有了一个重要特征:隔离性。数据库为了允许事务受不同程度的干扰,就有了一种重要特征:隔离级别
1、数据库的四种隔离级别:
读未提交【Read Uncommitted】:
在该隔离级别,所有的事务都可以看到其他事务没有提交的执行结果。(实际生产中不可能使用这种隔离级别的),但是相当于没有任何隔离性,也会有很多并发问题,如脏读,幻读,不可重复读等,我们上面为了做实验方便,用的就是这个隔离性。
读提交【Read Committed】 :
该隔离级别是大多数数据库的默认的隔离级别(不是 MySQL 默认的)。它满足了隔离的简单定义:一个事务只能看到其他的已经提交的事务所做的改变。这种隔离级别会引起不可重复读,即一个事务执行时,如果多次 select, 可能得到不同的结果。
可重复读【Repeatable Read】:
这是 MySQL 默认的隔离级别,它确保同一个事务,在执行中,多次读取操作数据时,会看到同样的数据行。但是会有幻读问题。
串行化【Serializable】:
这是事务的最高隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决了幻读的问题。它在每个读的数据行上面加上共享锁。但是可能会导致超时和锁竞争(这种隔离级别太极端,实际生产基本不使用)。
2、事务隔离级别查看及设置命令:
-- 查看
select @@session.transaction_isolation;
select @@global.transaction_isolation;
-- 设置
set session transaction isolation level 隔离级别名称
set global transaction isolation level 隔离级别的名称
六、事务隔离级别的实现
1、核心实现机制
1.1、 MVCC(多版本并发控制)
- 核心思想:每个事务看到的数据版本(快照)独立,通过版本链实现非锁定读。
- 关键组件:
- Undo Log:存储数据的历史版本,形成版本链。
- Read View:事务开启时生成的“数据可见性规则”,决定哪些版本对当前事务可见。
- 隐藏字段:
DB_TRX_ID
:记录最后一次修改该行的事务ID。DB_ROLL_PTR
:指向Undo Log中旧版本数据的指针。
1.2、数据读取
- 快照读**(默认):根据Read View遍历版本链,找到满足可见性条件的最新版本。
-- 普通SELECT语句,触发快照读
SELECT * FROM users WHERE id = 1;
- 当前读:显式加锁,直接读取最新数据并加锁。
-- 加锁读(当前读)
SELECT * FROM users WHERE id = 1 FOR UPDATE; -- 加排他锁
SELECT * FROM users WHERE id = 1 LOCK IN SHARE MODE; -- 加共享锁
1.3、 锁机制
- 行级锁(Record Lock):锁住单行记录。
- 间隙锁(Gap Lock):锁住索引记录的间隙,防止插入。
- 临键锁(Next-Key Lock):行锁 + 间隙锁,解决幻读问题。
2、不同隔离级别的实现
2.1、READ UNCOMMITTED(读未提交)
-
实现方式:直接读取数据页的最新版本,不生成Read View,不检查事务状态。
-
问题:可能读到其他事务未提交的数据(脏读)。
-
示例:
-- 事务A未提交,事务B能直接读取到新值 -- 事务A: UPDATE users SET name='Bob' WHERE id=1; -- 事务B: SELECT name FROM users WHERE id=1; -- 可能返回'Bob'
2.2、READ COMMITTED(读已提交)
-
实现方式:
- 每次执行
SELECT
时生成新的Read View。 - 仅读取已提交的事务修改的数据版本。
- 每次执行
-
关键规则:
- 数据行的
DB_TRX_ID
必须小于等于当前事务ID且已提交。
- 数据行的
-
示例:
-- 事务A提交前,事务B的两次查询结果可能不同 -- 事务A: UPDATE users SET name='Bob' WHERE id=1; (未提交) -- 事务B: SELECT name FROM users WHERE id=1; -- 返回旧值(如'Alice') -- 事务A: COMMIT; -- 事务B: SELECT name FROM users WHERE id=1; -- 返回'Bob'
2.3、REPEATABLE READ(可重复读)
-
实现方式:
- 事务第一次
SELECT
时生成Read View,后续复用该视图。 - 通过Next-Key Lock防止幻读(针对当前事务的写操作)。
- 事务第一次
-
关键规则:
- 数据行的
DB_TRX_ID
必须小于当前事务ID,或属于当前事务自身修改。
- 数据行的
-
示例:
-- 事务A两次查询结果一致,即使其他事务插入新数据 -- 事务A: SELECT * FROM users WHERE age > 20; -- 返回id=1,2 -- 事务B: INSERT INTO users (id, age) VALUES (3, 25); COMMIT; -- 事务A: SELECT * FROM users WHERE age > 20; -- 仍返回id=1,2(无幻读)
2.4、SERIALIZABLE(串行化)
- 实现方式:
- 所有读操作隐式加共享锁(
SELECT ... LOCK IN SHARE MODE
)。 - 通过强制串行执行避免并发问题。
- 所有读操作隐式加共享锁(
- 性能影响:高一致性但并发性能显著下降。
3、当前读的幻读问题
MySQL的REPEATABLE READ通过MVCC和Next-Key Lock解决了大部分幻读问题,但严格遵循SQL标准时仍存在理论幻读可能。
场景 | 是否发生幻读 | 原因 |
---|---|---|
纯快照读(仅SELECT) | ❌ 不发生 | Read View过滤其他事务插入的新数据。 |
混合快照读与当前读(如UPDATE) | ⚠️ 可能发生 | 当前读引入其他事务已提交的新数据,导致后续快照读可见自身修改。 |
锁范围不完整 | ⚠️ 可能发生 | 临键锁未覆盖全部间隙,其他事务在未锁定范围插入数据。 |
应对策略:
- 统一使用当前读:事务内所有操作显式加锁(
SELECT ... FOR UPDATE
),强制通过锁机制防护幻读。 - 合理设计索引:确保查询条件命中索引,使临键锁精确锁定目标范围。
- 避免混合读模式:事务内尽量避免快照读与当前读混用,减少一致性视图的意外穿透。