文章详情

短信预约信息系统项目管理师 报名、考试、查分时间动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

如何保证缓存和数据库一致性

2015-01-22 14:45

关注

如何保证缓存和数据库一致性

[TOC]

多年前在一次面试中,被问到如果数据更新,先修改数据库还是先修改缓存。因为没有想过,所以比较懵逼,时候赶紧搜索,发现这里面很有学问。基本上所有的文章最终都指向了两个地方,就是Oracle和Hazelcast对缓存更新策略的介绍。

Cache-Aside

常见的应用端策略,从数据库加载数据到缓存的模式。

应用服务自己选择是否使用缓存,并维护缓存的生命周期。这是最简单的实现方式,但是会有遇到一些问题。分为两种情况:

读取数据

检查缓存遗漏,然后查询数据库,填充缓存

  1. 尝试读缓存
  2. 如果命中,返回数据
  3. 如果未命中,查询数据库,并写入缓存

这会导致缓存击穿,需要双重检查锁定(Double Check Lock)确保单个线程访问数据库,但是会增加锁开销。

修改数据

修改数据库和缓存,因为缓存和数据库是两个系统,操作的先后顺序会导致一致性问题。

通常由几种方案:

先更新数据库,后更新缓存

如果两个线程同时更新,先更新的线程因为某些原因(时间片耗尽),后更新缓存,那么缓存里就是脏数据。

participant 业务
participant 数据库
participant 缓存
业务->数据库: A线程:更新
业务->数据库: B线程:更新
数据库->数据库: A线程:挂起
数据库->缓存: B线程:更新
数据库->缓存: A线程:更新

先更新缓存,后更新数据库

数据库错误,然后回滚了,但是这段时间里,缓存被用了。

participant 业务
participant 数据库
participant 缓存
业务->数据库: A线程:更新
数据库->缓存: A线程:更新
业务->缓存: B线程:获取
缓存->业务: B线程:取得未提交的数据
缓存-->数据库: A线程:更新
note right of 数据库:回滚

先删除缓存,后更新数据库

一个线程删除了缓存,还没来得及更新数据库,另一个线程来取缓存,发现取不到,查询数据库,并把旧数据放入缓存。最后数据库被更新为最新值。

participant 业务
participant 缓存
participant 数据库
业务->缓存: A线程:删除
业务->缓存: B线程:获取
缓存-->业务: B线程:未命中
业务->数据库: B线程:查询
数据库->缓存: B线程:更新
缓存->数据库: A线程:更新

先更新数据库,后删除缓存

先更新数据库,后删除缓存,如果失败直接回滚,其他线程不会读到脏数据。事务提交后,后续线程从数据库读取最新值放入缓存。会引起缓存击穿,需要做DCL。在极端情况下,线程在删除缓存之前被终止,那么缓存里是脏数据。

participant 业务
participant 缓存
participant 数据库
业务->数据库: A线程:更新
数据库->缓存: A线程:删除
业务->缓存: B线程:获取
缓存-->业务: B线程:未命中
业务->数据库: B线程:查询
数据库->缓存: B线程:更新

还有一种更极端的情况,当前一个线程删除缓存之后。A线程查询缓存miss,然后查询数据库,并试图更新缓存,但是被挂起。此时B线程更新数据库,并删除缓存,然后A获得时间片,将B更新前的旧数据放入缓存。缓存里成为了脏数据。

Read-Through

应用尝试获取缓存时,如果未命中,由缓存负责查询数据库并更新缓存,然后返回数据。

Write-Through

尝试更新数据时,只更新缓存数据,由缓存负责把修改同步到数据库。如果操作数据库异常,则回滚事务,把异常抛给应用。

Read-Through和Write-Through 通常是缓存服务一起提供的策略,如果缓存服务不支持,需要自己动手封装。本质上就是把缓存操作纳入事务管理,由缓存服务封装在一起提供给应用。应用只需提供对数据库操作的实现,然后使用缓存即可。

仍然存在极端情况,即服务更新缓存后,在写入数据库之前被终止。

Write-Behind

一种缓存服务端的策略,当应用尝试更新数据时,只更新缓存数据。缓存服务会把修改放入一个队列,异步的更新到数据库。

有的缓存服务会批量同步,并合并对同一条记录的多次操作,只更新最新记录。

如果更新数据库异常,需要不断重试,知道数据库更新成功,因为缓存中数据已经生效。

这样做有四个优点:

但是必须先解决几个问题:

还有一种类似做法,就是通过订阅MySQL的binlog,异步更新缓存。可以保证最终一致性,但是需要容忍一定的延迟。

Refresh-Ahead

相比于上述为了保证一致性的策略,这是一个辅助措施。即对于设置了过期时间的缓存,在即将到期时,异步查询数据库,更新到缓存。能够尽可能减少脏数据,并保证一致性和效率。这是因为:

总之,分布式系统很难两全其美,需要在A和C之间做出取舍,根据业务需要和经济基础选择最合适的方案。

其他参考资料:

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯