文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

通俗易懂的MySQL事务及MVCC原理

2024-12-02 17:59

关注

由引擎层支持事务,MyISAM就不支持事务,而InnoDB是支持事务的。

事务具有以下四大特性(ACID):

简单罗列了一下4种特性以及对应的实现方式,有关ACID详细的实现原理,会另开篇幅!

二、脏读、不可重复读与幻读

当事务存在并发时,就会产生以下问题。

脏读

即读取到别的事务未提交的数据。

A事务读取B事务尚未提交的数据,此时如果B事务发生错误并执行回滚操作,那么A事务读取到的数据就是脏数据。

就好像原本的数据比较干净、纯粹,此时由于B事务更改了它,这个数据变得不再纯粹。

这个时候A事务立即读取了这个脏数据,但事务B良心发现,又用回滚把数据恢复成原来干净、纯粹的样子,而事务A却什么都不知道,最终结果就是事务A读取了此次的脏数据,称为脏读。

这种情况常发生于转账与取款操作中

不可重复读

即某个事务前后多次读取,数据内容不一致。

事务A在执行读取操作,由整个事务A比较大,前后读取同一条数据需要经历很长的时间 。

而在事务A第一次读取数据,比如此时读取了小明的年龄为20岁,事务B执行更改操作,将小明的年龄更改为30岁,此时事务A第二次读取到小明的年龄时,发现其年龄是30岁,和之前的数据不一样了,也就是数据不重复了,系统不可以读取到重复的数据,成为不可重复读。

幻读

即某个事务前后多次读取,读到的数据总量不一致。

事务A在执行读取操作,需要两次统计数据的总量,前一次查询数据总量后,此时事务B执行了新增数据的操作并提交后,这个时候事务A读取的数据总量和之前统计的不一样,就像产生了幻觉一样,平白无故的多了几条数据,称为幻读。

三、事务隔离级别

事务隔离级别,就是在不同程度上解决以上的问题。

有四种隔离级别,分别是

读未提交

在这种隔离级别下,所有事务能够读取其他事务未提交的数据。

读取其他事务未提交的数据,会造成脏读。因此在该种隔离级别下,不能解决脏读、不可重复读和幻读。

读未提交可能会产生脏读的现象,那么怎么解决脏读呢?那就是使用读已提交。

读已提交

在这种隔离级别下,所有事务只能读取其他事务已经提交的内容。

能够彻底解决脏读的现象。但在这种隔离级别下,会出现一个事务的前后多次的查询中却返回了不同内容的数据的现象,也就是出现了不可重复读。

这是大多数数据库系统默认的隔离级别,例如Oracle和SQL Server,但mysql不是。

已提交可能会产生不可重复读的现象,我们可以使用可重复读。

可重复读

在这种隔离级别下,所有事务前后多次的读取到的数据内容是不变的。

也就是某个事务在执行的过程中,不允许其他事务进行update操作,但允许其他事务进行add操作,造成某个事务前后多次读取到的数据总量不一致的现象,从而产生幻读。

这才是mysql的默认事务隔离级别

可重复读依然会产生幻读的现象,此时我们可以使用串行化来解决。

串行化

在这种隔离级别下,所有的事务顺序执行,所以他们之间不存在冲突,从而能有效地解决脏读、不可重复读和幻读的现象。

但是安全和效率不能兼得,串行化会大大降低数据库的性能,一般不使用这种级别。

下面用一张表格来表示他们能够解决的问题,x代表未解决,√代表能够解决。

 

当然,以上所说的隔离级别及当前级别存在的问题只是一种规范,不同的数据库厂商可以有不同的实现。

例如在mysql的可重复读的级别上,使用临键锁的方式就已经解决了幻读的问题。

四、MVCC

mysql为了实现以上隔离级别,提出了LBCC(Lock-Based Concurrent Control,基于锁的并发控制)与MVCC(Multi-Version Concurrent Control,基于多版本的并发控制)。

在LBCC中,读写冲突,会使用诸如记录锁、间隙锁与临键锁等锁来实现数据的并发安全,因此读写性能不高。关于锁的分类,可以参考我的另外一篇文章谈谈锁的类型

在MVCC中,读写不冲突,记录每一行的多个版本,来避免在多个事务之间的竞争。以空间换时间的思路,极大地提高了读写性能。

[[433198]]

MVCC主要靠undo log版本链与ReadView来实现。

先对undo log有一个基本的认识

Undo log

undo log主要用于事务回滚时恢复原来的数据

mysql在执行sql语句时,会将一条逻辑相反的日志保存到undo log中。因此,undo log中记录的也是逻辑日志。

当sql语句为insert时,会在undo log中记录本次插入的主键id。等事务回滚时,delete此id即可。

当sql语句为update时,会在undo log中记录修改前的数据。等事务回滚时,再执行一次update,得到原来的数据。

当sql语句为delete时,会在undo log中记录删除前的数据。等事务回滚时,insert原来的数据即可。

数据库事务四大特性中的原子性,即事务具有不可分割性,要么全部成功,要么全部失败,其底层就靠undo log实现。在某一步执行失败时,会对之前事务的语句进行回滚。

对数据库中的日志完全不熟悉的话,可以看我的另外一篇文章数据库日志——binlog、redo log、undo log扫盲

行的隐藏列

在数据库中的每一行上,除了存放真实的数据以外,还存在着3个隐藏列——row_id、trx_id与roll_pointer。

row_id,行号

如果当前表有整数类型的主键,则row_id就是主键的值。

如果没有整数类型的主键,则mysql会按照字段顺序选择一个非空的整数类型的唯一索引作为row_id。

如果mysql没有找到,则会自动生成一个自动增长的整数作为row_id。

那row_id和今天的MVCC有什么关系呢?

不能说一点没有吧,只能说毫无关系。

trx_id,事务号

当一个事务开始执前,mysql会为这个事务分配一个全局自增的事务id。

之后该事务对当前行进行的增、删、改操作时,都会将自己的事务id记录到trx_id中。

roll_pointer,回滚指针

事务对当前行进行改动时,会将旧数据写入进undo log中,再将新数据写入当前行,且当前行的roll_pointer指向刚才那个undo log,因此可以通过roll_pointer找到该行的前一个版本。

当一直有事务对该行改动时,就会一直生成undo log,最终将会形成undo log版本链。

Undo log版本链

一开始,我们使用以下语句创建一个stduent表

  1. CREATE TABLE `student` ( 
  2.     `id` INT ( 11 ) NOT NULL AUTO_INCREMENT, 
  3.     `nameVARCHAR ( 255 ) NOT NULL
  4.     `age` INT ( 11 ) NOT NULL
  5.   PRIMARY KEY ( `id` ) USING BTREE  
  6. ) ENGINE = INNODB; 

现在开启第1个事务,事务id为1,执行以下插入语句。

  1. INSERT INTO student VALUES ( 1, "a", 24 ); 

那么当前行的一个示意图如下:

因为该数据是新插入的,因此它的roll_pointer指向的undo log为空。

接着开启第2个事务,分配的事务id是2,执行以下修改命令。

  1. UPDATE student SET NAME = 'b' WHERE id = 1; 

现在的示意图变为:

当开启第3个事务,分配到事务id是3,执行以下修改命令。

  1. UPDATE student SET age = 25 WHERE id = 1; 

示意图变为:

每一个事务对该行改动时,都会生成一个undo log,用于保存之前的版本,之后再将新版本的roll_pointer指向刚才生成的undo log。

因此roll_pointer可以将这些不同版本的undo log串联起来,形成undo log版本链。

ReadView

首先需要理解一下快照读与当前读

快照读:简单的select查询,即不包括 select ... lock in share mode, select ... for update,可能会读到数据的历史版本。

当前读:以下语句都是当前读,总是读取最新版本,会对读取的最新版本加锁。

在事务执行每一个快照读或事务初次执行快照读时,会生成一致性视图,即ReadView。

ReadView的作用是,判断undo log版本链中的哪些数据对当前事务可见。

ReadView包含以下几个重要的参数:

m_ids

在创建ReadView的那一刻,mysql中所有未提交的事务id集合。

min_trx_id

m_ids中的最小值

max_trx_id

mysql即将为下一个事务分配的事务id,并不是m_ids中的最大值。

creator_trx_id

即创建此ReadView的事务id

简要的示意图如下:

那么事务在执行快照读时,可以通过以下的规则来确定undo log版本链上的哪个版本数据可见。

如果当前undo log的版本的trx_id

如果当前undo log的版本的trx_id≥max_trx_id,说明该版本对应的事务在生成ReadView之后才开始的,因此是不可见的。

如果当前undo log的版本的trx_id∈[min_trx_id,max_trx_id),如果在这个范围里,还要判断trx_id是否在m_ids中:

在m_ids中,说明版本对应的事务未提交,因此是不可见的。

不在m_ids中,说明版本对应的事务已经提交,因此是可见的。

如果当前undo log的版本的trx_id=creator_trxt_id,说明事务正在访问自己修改的数据,因此是可见的。

当undo log版本链表的头结点数据被判定为不可见时,则利用roll_pointer找到上一个版本,再进行判断。如果整个链表中都没有找到可见的数据,则代表当前的查询找不到数据。

[[433201]]

MVCC在四种隔离级别下的区别

在Read Uncommitted级别下,事务总是读取到最新的数据,因此根本用不到历史版本,所以MVCC不在该级别下工作。

在Serializable级别下,事务总是顺序执行。写会加写锁,读会加读锁,完全用不到MVCC,所以MVCC也不在该级别下工作。

真正和MVCC兼容的隔离级别是Read Committed(RC)与Repeatable Read(RR)

MVCC在RC与RR级别下的区别,在于生成ReadView的频率不同。

在RC级别下,当前事务总是希望读取到别的事务已经提交的数据,因此当前事务事务会在执行每一次快照读的情况下都会去生成ReadView,实时更新m_ids,及时发现那些已经提交的事务。

在RR级别下,当前事务当然也能够读取到别的事务已经提交的数据,但为了避免不可重复读,因此只会在执行第一次快照读的情况下去生成ReadView,之后的快照读会一直沿用该ReadView。

举个栗子:

在RC级别下

一开始,事务id为1的事务往表里插入了一条数据,版本链如下:

这个时候,开启事务id为2的事务,关闭自动提交模式。先执行一次select *查询,生成的ReadView如下

  1. m_ids={2},min_trx_id=2,max_trx_id=3,creator_trx_id=2 

由于该条数据的trx_id

因此,事务2能直接查到该数据。

现在开启事务3,事务id为3,将该条数据的name改为b,并自动提交,版本链如下:

这个时候,事务2再次select *查询,由于处于RC级别下,会再次生成ReadView,此时的ReadView如下:

  1. m_ids={2},min_trx_id=2,max_trx_id=4,creator_trx_id=2 

由于最新版本的trx_id∈[2,4)且trx_id不在m_ids中,说明该版本的数据已经提交,因此是可见的,所以事务2能查到最新的数据。

而处于RR级别下:

事务2再次select *查询时,不会生成ReadView,而是沿用第一次生成的ReadView:

  1. m_ids={2},min_trx_id=2,max_trx_id=3,creator_trx_id=2 

由于最新版本的trx_id≥max_trx_id,说明该版本对应的事务在生成ReadView之后才开始的,因此是不可见的。

所以沿着roll_pointer找到上一个版本,上一个版本的trx_id

所以,事务2只能查询到旧版本的数据,两次的查询一致,避免了不可重复读。

 

来源:今日头条内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯