内容简介:最近在公司对redis做一些二次开发时,发现一个由于我们公司使用的是redis集群版Codis,Codis内置的redis版本比较低,为3.2.9版本。我们近期在做Codis双机房时,需要对redis增加一些功能以此支持双机房,在开发和测试中发现,执行
最近在公司对 redis 做一些二次开发时,发现一个 randomkey
命令可能导致整个redis实例长时间阻塞的问题,redis版本为3.2.9,以此记录。
问题
由于我们公司使用的是redis集群版Codis,Codis内置的redis版本比较低,为3.2.9版本。
我们近期在做Codis双机房时,需要对redis增加一些功能以此支持双机房,在开发和测试中发现,执行 randomkey
命令有可能导致整个redis长时间阻塞的问题。
randomkey
主要功能是在redis中随机返回一个key出来,它随机选取key的代码如下。
robj *dbRandomKey(redisDb *db) {
dictEntry *de;
// 死循环从哈希表中找到一个不过期的key
while(1) {
sds key;
robj *keyobj;
// 从实例的哈希表里随机一个元素
de = dictGetRandomKey(db->dict);
if (de == NULL) return NULL;
// 获取这个元素的key
key = dictGetKey(de);
keyobj = createStringObject(key,sdslen(key));
// 如果key已经过期 则把这个key从实例中删除
// 注意:expireIfNeeded对于过期的key只针对master有效
// 如果是slave则永远不会删除key
if (dictFind(db->expires,key)) {
if (expireIfNeeded(db,keyobj)) {
decrRefCount(keyobj);
continue;
}
}
return keyobj;
}
}
从上面代码可以看出来,如果当前是个slave,并且整个实例中存在大量已经过期的key(key已过期,但redis还未来得及删除key),执行 randomkey
命令时,由于找不到不过期的key,那么这个逻辑就会陷入 死循环
,阻塞住整个实例,整个实例不可用。
如果当前是master,执行 randomkey
命令时,redis会一直随机选择key,直到找到一个不过期的key,同时会把已经过期的key从整个实例中删除。也就是说,在这种场景下,虽然不会长时间阻塞整个实例,但也会比执行一个普通的命令耗时要久。如果你在一个大量已过期的实例上执行 randomkey
命令,那可能会导致业务访问redis变慢。
解决
我们对比了官方最新版的redis,已经针对此问题进行了修复。
robj *dbRandomKey(redisDb *db) {
dictEntry *de;
// 当前实例全部都是过期key 最大循环100次
int maxtries = 100;
int allvolatile = dictSize(db->dict) == dictSize(db->expires)
// 死循环从哈希表中找到一个不过期的key
while(1) {
sds key;
robj *keyobj;
// 从实例的哈希表里随机一个元素
de = dictGetRandomKey(db->dict);
if (de == NULL) return NULL;
// 获取这个元素的key
key = dictGetKey(de);
keyobj = createStringObject(key,sdslen(key));
// 如果key已经过期 则把这个key从实例中删除
// 注意:expireIfNeeded对于过期的key只针对master有效
// 如果是slave则永远不会删除key
if (dictFind(db->expires,key)) {
// 如果整个实例都是过期key 在slave上执行此命令最多循环100次 避免长时间阻塞
if (allvolatile && server.masterhost && --maxtries == 0) {
return keyobj;
}
if (expireIfNeeded(db,keyobj)) {
decrRefCount(keyobj);
continue;
}
}
return keyobj;
}
}
解决方案就是增加一个 最大重试次数
,如果整个实例都是过期key,那么最多寻找 maxtries
次就返回,避免阻塞整个实例。
注意点
但要注意的是,如果达到了 maxtries
,那么返回的key是已经过期的key,你虽然在 randomkey
中看到了这个key,但对这个key执行其他命令时,还是拿不到这个key的。
这个方案只针对slave上执行这个命令进行了修复,也就是不会再让redis陷入死循环。
但在master上执行这个命令还是会发生上述的变慢问题,如果你在使用redis时,经常使用这个命令,同时实例中存在大量已经过期的key,那么redis变慢很有可能是这个问题导致的。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- Node.js 指南(阻塞与非阻塞概述)
- Node.js 回调函数 阻塞与非阻塞
- 明明白白学 同步、异步、阻塞与非阻塞
- 从 Linux 源码看 socket 的阻塞和非阻塞
- 分布式系统关注点——阻塞与非阻塞有什么区别?
- Netty基础系列(2) --彻底理解阻塞非阻塞与同步异步的区别
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
VC++深入详解
孙鑫 / 电子工业出版社 / 2006-6 / 89.00元
《VC++深入详解》主要从程序内部运行的机制和MFC程序的组织脉络入手,使读者在学习VC++编程知识时,既能够知其然,又能知其所以然,从而帮助读者从根本上理解和掌握Windows的程序设计。另外,《VC++深入详解》还贯穿作者多年来学习编程的一些经验,以及一些学习方法的建议,为读者进一步的学习提供指导。 《VC++深入详解》从实际应用入手,由浅入深、循序渐进地讲述Windows程......一起来看看 《VC++深入详解》 这本书的介绍吧!