Jack Frost

Redis系列(三)–过期策略

制定Redis过期策略,是整个Redis缓存策略的关键之一,因为内存来说,公司不可能无限大,所以就要对key进行一系列的管控。

文章结构:(1)理解Redis过期设置API(命令与Java描述版本);(2)理解Redis内部的过期策略;(3)对开发需求而言,Redis过期策略的设计实现经验。


本系列文章:

(1) Redis系列(一)–安装、helloworld以及读懂配置文件

(2)Redis系列(二)–缓存设计(整表缓存以及排行榜缓存方案实现)

一、理解Redis过期设置API(命令与Java描述版本):

(1)TTL命令:

返回值

当 key 不存在时,返回 -2 。 当 key 存在但没有设置剩余生存时间时,返回 -1 。 否则,以秒为单位,返回 key 的剩余生存时间。

注意:在 Redis 2.8 以前,当 key 不存在,或者 key 没有设置剩余生存时间时,命令都返回 -1 。

(2)EXPIRE命令

定义:为给定 key 设置生存时间,当 key 过期时(生存时间为 0 ),它会被自动删除。

返回值

设置成功返回 1 。 当 key 不存在或者不能为 key 设置过期时间时(比如在低于 2.1.3 版本的 Redis 中你尝试更新 key 的过期时间)返回 0 。

key生存时间注意点:

生存时间可以通过使用 DEL 命令来删除整个 key 来移除,或者被 SET 和 GETSET 命令覆写(overwrite),这意味着,如果一个命令只是修改(alter)一个带生存时间的 key 的值而不是用一个新的 key 值来代替(replace)它的话,那么生存时间不会被改变。

比如说,对一个 key 执行 INCR 命令,对一个列表进行 LPUSH 命令,或者对一个哈希表执行 HSET 命令,这类操作都不会修改 key 本身的生存时间。

另一方面,如果使用 RENAME 对一个 key 进行改名,那么改名后的 key 的生存时间和改名前一样。

RENAME 命令的另一种可能是,尝试将一个带生存时间的 key 改名成另一个带生存时间的 another_key ,这时旧的 another_key (以及它的生存时间)会被删除,然后旧的 key 会改名为 another_key ,因此,新的 another_key 的生存时间也和原本的 key 一样。

(3)PEXPIRE命令

设置成功返回 1 。 当 key 不存在或者不能为 key 设置过期时间时(比如在低于 2.1.3 版本的 Redis 中你尝试更新 key 的过期时间)返回 0 。

(4)PERSIST 命令

返回值:

当过期时间移除成功时,返回 1 。 如果 key 不存在或 key 没有设置过期时间,返回 0 。

(5)SETEX命令

用于在Redis键中的指定超时,设置键的字符串值

返回值:

字符串,如果在键中设置了值则返回OK。如果值未设置则返回 Null。

(6)补充:(精度不同的时间设置):

EXPIREAT < timestamp> 命令用于将键key 的过期时间设置为timestamp所指定的秒数时间戳。

PEXPIREAT < timestamp > 命令用于将键key 的过期时间设置为timestamp所指定的毫秒数时间戳。

例子:

(6)Java代码控制:


二、理解Redis内部的过期策略:

(1)总述:

Redis采用的是定期删除策略和懒汉式的策略互相配合。

注意!是Redis内部自主完成!是Redis内部自主完成!是Redis内部自主完成!

我们只可以通过调整外围参数,以及设计数据淘汰模式去调控我们的Redis缓存系统过期策略。

(2)定期删除策略:

1)含义:每隔一段时间执行一次删除过期key操作

2)优点:

通过限制删除操作的时长和频率,来减少删除操作对CPU时间的占用–处理”定时删除”的缺点

定期删除过期key–处理”懒汉式删除”的缺点

3)缺点:

在内存友好方面,会造成一定的内存占用,但是没有懒汉式那么占用内存(相对于定时删除则不如)

在CPU时间友好方面,不如”懒汉式删除”(会定期的去进行比较和删除操作,cpu方面不如懒汉式,但是比定时好)

4)关键点:

合理设置删除操作的执行时长(每次删除执行多长时间)和执行频率(每隔多长时间做一次删除)(这个要根据服务器运行情况来定了),每次执行时间太长,或者执行频率太高对cpu都是一种压力。

每次进行定期删除操作执行之后,需要记录遍历循环到了哪个标志位,以便下一次定期时间来时,从上次位置开始进行循环遍历。

对于懒汉式删除而言,并不是只有获取key的时候才会检查key是否过期,在某些设置key的方法上也会检查(例子:setnx key2 value2:如果设置的key2已经存在,那么该方法返回false,什么都不做;如果设置的key2不存在,那么该方法设置缓存key2-value2。假设调用此方法的时候,发现redis中已经存在了key2,但是该key2已经过期了,如果此时不执行删除操作的话,setnx方法将会直接返回false,也就是说此时并没有重新设置key2-value2成功,所以对于一定要在setnx执行之前,对key2进行过期检查)。

5)删除键流程(简单而言,对指定个数个库的每一个库随机删除小于等于指定个数个过期key):

1. 遍历每个数据库(就是redis.conf中配置的”database”数量,默认为16)

2. 检查当前库中的指定个数个key(默认是每个库检查20个key,注意相当于该循环执行20次,循环体是下边的描述)

如果当前库中没有一个key设置了过期时间,直接执行下一个库的遍历
随机获取一个设置了过期时间的key,检查该key是否过期,如果过期,删除key
判断定期删除操作是否已经达到指定时长,若已经达到,直接退出定期删除。

对于定期删除,在程序中有一个全局变量current_db来记录下一个将要遍历的库,假设有16个库,我们这一次定期删除遍历了10个,那此时的current_db就是11,下一次定期删除就从第11个库开始遍历,假设current_db等于15了,那么之后遍历就再从0号库开始(此时current_db==0)

6)源码机制阅读:

定期删除策略:此部分转载部分此博主此文章

在redis源码中,实现定期淘汰策略的是函数activeExpireCycle,每当周期性函数serverCron执行时,该函数会调用databasesCron函数;然后databasesCron会调用activeExpireCycle函数进行主动的过期键删除。具体方法是在规定的时间内,多次从expires中随机挑一个键,检查它是否过期,如果过期则删除。

首先这个函数有两种执行模式,一个是快速模式一个是慢速模式,体现在代码中就是timelimit这个变量中,这个变量是用来约束这个函数的运行时间的,我们可以考虑这样一个场景,就是数据库中有很多过期的键需要清理,那么这个函数就会一直运行很长时间,这样一直占用CPU显然是不合理的,所以需要这个变量来约束,当函数运行时间超过了这个阈值,就算还有很多过期键没有清理,函数也强制退出。

在快速模式下,timelimit的值是固定的,是一个预定义的常量ACTIVE_EXPIRE_CYCLE_FAST_DURATION,在慢速模式下,这个变量的值是通过下面的代码计算的。

他的计算依据是之前预定义好的每次迭代只能占用的CPU时间比例,以及这个函数被调用的频率。

Redis中也可能有多个数据库,所以这个函数会遍历多个数据库来清楚过期键 ,但是是根据下面代码的原则来确定要遍历的数据库的个数的。

dbs_per_call变量就是函数会遍历的数据库的个数,他有一个预定义的值REDIS_DBCRON_DBS_PER_CALL,但是如果这个值大于现在redis中本身的数据库的个数,我们就要将它的值变成当前的数据库的实际个数,或者上次的函数是因为超时强制退出了,说明可能有的数据库在上次函数调用时没有遍历到,里面的过期键没有清理掉,所以也要将这次遍历的数据库的个数改成实际数据库的个数。

上面代码可以看出:数据库的遍历是在这个大的for循环里,其中值得留意的是current_db这个变量是一个static变量,这么做的好处是,如果真的发生了我们上面说的情况,上一次函数调用因为超时而强制退出,这个变量就会记录下这一次函数应该从哪个数据库开始遍历,这样会使得函数用在每个数据库的时间尽量平均,就不会出现有的数据库里面的过期键一直没有清理的情况。

每个数据库的过期键清理的操作是在下面的这个do while 循环中(由于代码过长,所以中间有很多代码我把它隐藏了,现在看到的只是一个大框架,稍后我会对其中的部分详细讲解)

注意while循环条件,ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP是我们每个循环希望查到的过期键的个数,如果我们每次循环过后,被清理的过期键的个数超过了我们期望的四分之一,我们就会继续这个循环,因为这说明当前数据库中过期键的个数比较多,需要继续清理,如果没有达到我们期望的四分之一,就跳出while循环,遍历下一个数据库。

这个函数最核心的功能就是清除过期键,这个功能的实现就是在while(num–)这个循环里面。

他先从数据库中设置了过期时间的键的集合中随机抽取一个键,然后调用activeExpireCycleTryExpire函数来判断这个键是否过期,如果过期就删除键,activeExpireCycleTryExpire函数的源码如下:

这个函数的逻辑很简单,就是先获取键de的过期时间,和现在的时间比较,如果过期,就生成该键de的对象,然后传播该键de的过期信息,并且删除这个键,然后增加过期键总数。

最后就是控制函数运行时间的部分了,代码如下:

这里有一个迭代次数的变量iteration,每迭代16次就来计算函数已经运行的时间,如果这个时间超过了之前的限定时间timelimit,就将timelimit_exit这个标志置为1,说明程序超时,需要强制退出了。

(3)懒惰淘汰策略:

1)含义:key过期的时候不删除,每次通过key获取值的时候去检查是否过期,若过期,则删除,返回null。

2)优点:删除操作只发生在通过key取值的时候发生,而且只删除当前key,所以对CPU时间的占用是比较少的,而且此时的删除是已经到了非做不可的地步(如果此时还不删除的话,我们就会获取到了已经过期的key了)

3)缺点:若大量的key在超出超时时间后,很久一段时间内,都没有被获取过,那么可能发生内存泄露(无用的垃圾占用了大量的内存)

4)懒惰式策略删除流程:

1. 在进行get或setnx等操作时,先检查key是否过期;

2. 若过期,删除key,然后执行相应操作; 若没过期,直接执行相应操作;

5)源码阅读:

在redis源码中,实现懒惰淘汰策略的是函数expireIfNeeded,所有读写数据库命令在执行之前都会调用expireIfNeeded函数对输入键进行检查。如果过期就删除,如果没过期就正常访问。

以上是expireIfNeeded函数的源码,源码中的注释已经很清楚的描述出了它的逻辑,我只是将他翻译成中文,然后加了一点自己的注释。值得注意的如果是slaves,它是不能自主删除键的,需要由master发del命令,然后同步到所有的slaves,这样就不会造成主从数据不一致的问题。

(4)策略总述:

懒惰淘汰机制和定时淘汰机制是一起合作的,就好像你开一家餐馆一样,定时淘汰机制就是你每隔几小时去查看所有的菜品是否还有,如果有的菜品现在卖光了,就将他从菜单上划掉。懒惰淘汰机制就是有客人要点宫保鸡丁,你马上去查看还有没有,如果今天的已经卖完了,就告诉客人不好意思,我们卖完了,然后将宫保鸡丁从菜单上划掉。只有等下次有原料再做的时候,才又把它放到菜单上去。

所以,在实际中,如果我们要自己设计过期策略,在使用懒汉式删除+定期删除时,控制时长和频率这个尤为关键,需要结合服务器性能,已经并发量等情况进行调整,以致最佳。


三、对开发需求而言,Redis过期策略的设计实现经验:代码在此工程里

(1)分析缓存键值的客户方角度,调和服务器内存压力

基于服务器内存是有限的,但是缓存是必须的,所以我们就要结合起来选择一个平衡点。所以一般来说,我们采取高访问量缓存策略—就是给那些经常被访问的数据,维持它较长的key生存周期。

(2)估算过期时间

这个就要结合我们自己的业务去估量了。

参考因素:数据的访问量、并发量,数据的变化更新的时间,服务器数据内存大小……

(3)Java演示一策略做法。

每次访问刷新对应key生存时间:

针对经常访问的数据的策略

源码下载:Redis系列(三)–过期策略的数据库以及部分实现代码

好了,Redis系列(三)–过期策略讲完了,这是redis使用优化必须理解的原理,这是积累的必经一步,我会继续出这个系列文章,分享经验给大家。欢迎在下面指出错误,共同学习!!你的点赞是对我最好的支持!!

更多内容,可以访问JackFrost的博客

码字很辛苦,转载请注明来自JackFrost《Redis系列(三)–过期策略》

Leave a Reply

Your email address will not be published. Required fields are marked *