Redis
今天来分享一下Redis几道常见的面试题:
回顾一下我们为什么要用缓存(Redis):
为什么要缓存
现在有个问题,如果我们的缓存挂掉了,这意味着我们的全部请求都跑去数据库了。
如果缓存挂掉了,全部请求跑去数据库了
在前面学习我们都知道Redis不可能把所有的数据都缓存起来(内存昂贵且有限),所以Redis需要对数据设置过期时间,并采用的是惰性删除+定期删除两种策略对过期键删除。Redis对过期键的策略+持久化
如果缓存数据设置的过期时间是相同的,并且Redis恰好将这部分数据全部删光了。这就会导致在这段时间内,这些缓存同时失效,全部请求到数据库中。
这就是缓存雪崩:
缓存雪崩如果发生了,很可能就把我们的数据库搞垮,导致整个服务瘫痪!
对于“对缓存数据设置相同的过期时间,导致某段时间内缓存失效,请求全部走数据库。”这种情况,非常好解决:
对于“Redis挂掉了,请求全部走数据库”这种情况,我们可以有以下的思路:
比如,我们有一张数据库表,ID都是从1开始的(正数):
随便找了一张数据库表
但是可能有黑客想把我的数据库搞垮,每次请求的ID都是负数。这会导致我的缓存就没用了,请求全部都找数据库去了,但数据库也没有这个值啊,所以每次都返回空出去。
缓存穿透是指查询一个一定不存在的数据。由于缓存不命中,并且出于容错考虑,如果从数据库查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询,失去了缓存的意义。
缓存穿透
这就是缓存穿透:
缓存穿透如果发生了,也可能把我们的数据库搞垮,导致整个服务瘫痪!
解决缓存穿透也有两种方案:
参考资料:
上面讲缓存穿透的时候也提到了:如果从数据库查不到数据则不写入缓存。
一般我们对读操作的时候有这么一个固定的套路:
如果仅仅查询的话,缓存的数据和数据库的数据是没问题的。但是,当我们要更新时候呢?各种情况很可能就造成数据库和缓存的数据不一致了。
数据库和缓存的数据不一致
从理论上说,只要我们设置了键的过期时间,我们就能保证缓存和数据库的数据最终是一致的。因为只要缓存数据过期了,就会被删除。随后读的时候,因为缓存里没有,就可以查数据库的数据,然后将数据库查出来的数据写入到缓存中。
除了设置过期时间,我们还需要做更多的措施来尽量避免数据库与缓存处于不一致的情况发生。
一般来说,执行更新操作时,我们会有两种选择:
首先,要明确的是,无论我们选择哪个,我们都希望这两个操作要么同时成功,要么同时失败。所以,这会演变成一个分布式事务的问题。
所以,如果原子性被破坏了,可能会有以下的情况:
如果第一步已经失败了,我们直接返回Exception出去就好了,第二步根本不会执行。
下面我们具体来分析一下吧。
操作缓存也有两种方案:
一般我们都是采取删除缓存缓存策略的,原因如下:
基于这两点,对于缓存在更新时而言,都是建议执行删除操作!
正常的情况是这样的:
如果原子性被破坏了:
如果在高并发的场景下,出现数据库与缓存数据不一致的概率特别低,也不是没有:
要达成上述情况,还是说一句概率特别低:
因为这个条件需要发生在读缓存时缓存失效,而且并发着有一个写操作。而实际上数据库的写操作会比读操作慢得多,而且还要锁表,而读操作必需在写操作前进入数据库操作,而又要晚于写操作更新缓存,所有的这些条件都具备的概率基本并不大。
对于这种策略,其实是一种设计模式:Cache Aside Pattern
先修改数据库,再删除缓存
删除缓存失败的解决思路:
正常情况是这样的:
如果原子性被破坏了:
看起来是很美好,但是我们在并发场景下分析一下,就知道还是有问题的了:
所以也会导致数据库和缓存不一致的问题。
并发下解决数据库与缓存不一致的思路:
将操作积压到队列中
我们可以发现,两种策略各自有优缺点:
Cache Aside Pattern
设计模式)可以用databus或者阿里的canal监听binlog进行更新。
参考资料: