文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

缓存穿透问题

2024-04-02 19:55

关注

 一. 缓存穿透 (请求数据缓存大量不命中):

    缓存穿透是指查询一个一定不存在的数据,由于缓存不命中,并且出于容错考虑, 如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。

    例如:下图是一个比较典型的cache-storage架构,cache(例如memcache, redis等等) + storage(例如mysql, hbase等等)架构,查一个压根就不存在的值, 如果不做兼容,永远会查询storage。

缓存穿透问题

二. 危害:

     对底层数据源(mysql, hbase, http接口, rpc调用等等)压力过大,有些底层数据源不具备高并发性。下载

     例如mysql一般来说单台能够扛1000-QPS就已经很不错了(别说你的查询都是select * from table where id=xx 以及你的机器多么牛逼,那就有点矫情了)

     例如他人提供的一个抗压性很差的http接口,可能穿透会击溃他的服务。

     缓存穿透问题

三. 如何发现:

   我们可以分别记录cache命中数, storage命中数,以及总调用量,如果发现空命中(cache,storage都没有命中)较多,可能就会在缓存穿透问题。下载

   注意:缓存本身的命中率(例如redis中的info提供了类似数字,只代表缓存本身)不代表storage和业务的命中率。

   

四. 产生原因以及业务是否允许?

    产生原因有很多:可能是代码本身或者数据存在的问题造成的,也很有可能是一些恶意***、爬虫等等(因为http读接口都是开放的)

    业务是否允许:这个要看做的项目或者业务是否允许这种情况发生,比如做一些非实时的推荐系统,假如新用户来了,确实没有他的推荐数据(推荐数据通常是根据历史行为算出),这种业务是会发生穿透现象的,至于业务允不允许要具体问题具体分析了。下载

 

五. 解决方法:

解决思路大致有两个,如下表。下面将分别说明

解决缓存穿透适用场景维护成本
缓存空对象

1. 数据命中不高

2. 数据频繁变化实时性高

1.代码维护简单

2.需要过多的缓存空间

3. 数据不一致

bloomfilter或者压缩filter提前拦截

1. 数据命中不高

2. 数据相对固定实时性低

1.代码维护复杂

2.缓存空间占用少

       1. 缓存空对象下载

         缓存穿透问题

        (1). 定义:如上图所示,当第②步MISS后,仍然将空对象保留到Cache中(可能是保留几分钟或者一段时间,具体问题具体分析),下次新的Request(同一个key)将会从Cache中获取到数据,保护了后端的Storage。

        (2) 适用场景:数据命中不高,数据频繁变化实时性高(一些乱转业务)

        (3) 维护成本:代码比较简单,但是有两个问题:

             第一是空值做了缓存,意味着缓存系统中存了更多的key-value,也就是需要更多空间(有人说空值没多少,但是架不住多啊),解决方法是我们可以设置一个较短的过期时间。

             第二是数据会有一段时间窗口的不一致,假如,Cache设置了5分钟过期,此时Storage确实有了这个数据的值,那此段时间就会出现数据不一致,解决方法是我们可以利用消息或者其他方式,清除掉Cache中的数据。

        (4) 伪代码:

Java代码  下载

  1. package com.carlosfu.service;  

  2.   

  3. import org.apache.commons.lang.StringUtils;  

  4.   

  5. import com.carlosfu.cache.Cache;  

  6. import com.carlosfu.storage.Storage;  

  7.   

  8.   

  9. public class XXXService {  

  10.   

  11.       

  12.     private Cache cache = new Cache();  

  13.   

  14.       

  15.     private Storage storage = new Storage();  

  16.   

  17.       

  18.     public String getNormal(String key) {  

  19.         // 从缓存中获取数据  

  20.         String cacheValue = cache.get(key);  

  21.         // 缓存为空  

  22.         if (StringUtils.isBlank(cacheValue)) {  

  23.             // 从存储中获取  

  24.             String storageValue = storage.get(key);  

  25.             // 如果存储数据不为空,将存储的值设置到缓存  

  26.             if (StringUtils.isNotBlank(storageValue)) {  

  27.                 cache.set(key, storageValue);  

  28.             }  

  29.             return storageValue;  

  30.         } else {  

  31.             // 缓存非空  

  32.             return cacheValue;  

  33.         }  

  34.     }  

  35.   

  36.   

  37.       

  38.     public String getPassThrough(String key) {  

  39.         // 从缓存中获取数据  

  40.         String cacheValue = cache.get(key);  

  41.         // 缓存为空  

  42.         if (StringUtils.isBlank(cacheValue)) {  

  43.             // 从存储中获取  

  44.             String storageValue = storage.get(key);  

  45.             cache.set(key, storageValue);  

  46.             // 如果存储数据为空,需要设置一个过期时间(300秒)  

  47.             if (StringUtils.isBlank(storageValue)) {  

  48.                 cache.expire(key, 60 * 5);  

  49.             }  

  50.             return storageValue;  

  51.         } else {  

  52.             // 缓存非空  

  53.             return cacheValue;  

  54.         }  

  55.     }  

  56.   

  57. }  

 

2. bloomfilter或者压缩filter(bitmap等等)提前拦截下载

缓存穿透问题

        (1). 定义:如上图所示,在访问所有资源(cache, storage)之前,将存在的key用布隆过滤器提前保存起来,做第一层拦截, 例如: 我们的推荐服务有4亿个用户uid, 我们会根据用户的历史行为进行推荐(非实时),所有的用户推荐数据放到hbase中,但是每天有许多新用户来到网站,这些用户在当天的访问就会穿透到hbase。为此我们每天4点对所有uid做一份布隆过滤器。如果布隆过滤器认为uid不存在,那么就不会访问hbase,在一定程度保护了hbase(减少30%左右)。下载

            

        (2) 适用场景:数据命中不高,数据相对固定实时性低(通常是数据集较大)

        (3) 维护成本:代码维护复杂, 缓存空间占用少

              第一是空值做了缓存,意味着缓存系统中存了更多的key-value,也就是需要更多空间(有人说空值没多少,但是架不住多啊),解决方法是我们可以设置一个较短的过期时间。

              第二是数据会有一段时间窗口的不一致,假如,Cache设置了5分钟过期,此时Storage确实有了这个数据的值,那此段时间就会出现数据不一致,解决方法是我们可以利用消息或者其他方式,清除掉Cache中的数据。


阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯