从源码看redis的string结构

栏目: 数据库 · 发布时间: 5年前

内容简介:如果在

set 用来存储string的类型数据

> set key hello
OK
复制代码

get 来获取string类型的值

> get key
"hello"
复制代码

如果在 set 执行的时候,key已经存在,则会覆盖原有key的值

> set key anotherValue
OK
> get key
"anotherValue"
复制代码

set命令执行追踪

redis.c 中数组 redisCommandTable 为所有暴漏出去的命令列表,以及实现命令的函数指针

struct redisCommand redisCommandTable[] = {
...
{"get",getCommand,2,"rF",0,NULL,1,1,1,0,0},
{"set",setCommand,-3,"wm",0,NULL,1,1,1,0,0},
...
}
复制代码

从这里可以看到 setCommand 即为 set方法的入口。

Code.SLICE.source("c->argv[2] = tryObjectEncoding(c->argv[2]);")
        .interpretation("在对set的格式做完语法校验,同时取得相应的命令属于 NX/XX/EX/PX/直接set之后,根据value来获取编码");
Code.SLICE.source("setGenericCommand(c,flags,c->argv[1],c->argv[2],expire,unit,NULL,NULL);")
        .interpretation("根据实际情况存储k-v对");
复制代码

在执行Set之前,redis并不是直接将原有传入的string储存,而是先选择了做一层编码,编码之后再来存

Code.SLICE.source("len = sdslen(s);")
        .interpretation("获取要存储的字符串值的长度,s取值即 redisObject指向的 数据字节指针");
Code.SLICE.source("if (len <= 20 && string2l(s,len,&value))")
        .interpretation("判断字符串的长度如果小于20并且能够转成long  类型,执行转成long 的逻辑,并结果存储到value");
//...
Code.SLICE.source("       o->encoding = OBJ_ENCODING_INT;\n" +
             "            o->ptr = (void*) value;")
        .interpretation("判定好是可以转成long则设定编码方式为int,同时数据指针就直接存储值");
//...
Code.SLICE.source("if (len <= OBJ_ENCODING_EMBSTR_SIZE_LIMIT) ")
        .interpretation("如果字符串长度满足emb的长度条件(44),使用emb编码,使得通过一次内存分配函数的调用就可以拿到连续的内存空间存储 redisObject和 数据 sdshdr");
//...
Code.SLICE.source("     emb = createEmbeddedStringObject(s,sdslen(s));")
        .interpretation("将值使用emb编码后再返回");
//...
Code.SLICE.source("if (o->encoding == OBJ_ENCODING_RAW &&\n" +
                "        sdsavail(s) > len/10)\n" +
                "    {\n" +
                "        o->ptr = sdsRemoveFreeSpace(o->ptr);\n" +
                "    }")
        .interpretation("如果超过了emb限制,则尽量的去较少浪费的空间,将原始的内容直接返回");
//...
复制代码

对于 string 来说,编码是根据value的长度来按照不同的编码方式处理

  • 小于等于20 并且能够转换成long,则存储成long类型的数字,指定编码为 OBJ_ENCODING_INT
  • 如果长度小于44,则创建EmbeddedString,指定编码为 OBJ_ENCODING_EMBSTR
  • 其它情况,指定编码为 OBJ_ENCODING_RAW

在转码过程中,传进来的数据会被转成 redisObject

typedef struct redisObject {
    unsigned type:4; //指string/list/hash/zset/set
    unsigned encoding:4; //数据自己的编码格式
    unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or
                            * LFU data (least significant 8 bits frequency
                            * and most significant 16 bits access time). */
    int refcount; //数据被引用的次数,为0表示可以安全回收这个对象
    void *ptr; //对象数据
} robj;
复制代码

实际存储的时候会去检查是否已经有同名的key

Code.SLICE.source(" if (lookupKeyWrite(db,key) == NULL) {\n" +
                "        dbAdd(db,key,val);\n" +
                "    } else {\n" +
                "        dbOverwrite(db,key,val);\n" +
                "    }")
                .interpretation("如果之前没有存过,就直接添加,否则去覆盖");
复制代码

每次在查找key的时候,同时也会去检查key是不是已经过期了,满足过期条件的key会被删除,然后再将传进来的string创建 sds 对象,存储起来

//...
Code.SLICE.source("char type = sdsReqType(initlen);")
        .interpretation("根据要新建的字符串获取不同的类型,类型就是宏定义的  0 1 2 3 4这5个取值的类型,代表不同的 sdshdr 结构\n");

//...
Code.SLICE.source("   switch(type) {\n" +
        "        case SDS_TYPE_5: {\n" +
        "            *fp = type | (initlen << SDS_TYPE_BITS);\n" +
        "            break;\n" +
        "        }\n" +
        "        case SDS_TYPE_8: {\n" +
        "            SDS_HDR_VAR(8,s);\n" +
        "            sh->len = initlen;\n" +
        "            sh->alloc = initlen;\n" +
        "            *fp = type;\n" +
        "            break;\n" +
        "        }\n" +
        "        case SDS_TYPE_16: {\n" +
        "            SDS_HDR_VAR(16,s);\n" +
        "            sh->len = initlen;\n" +
        "            sh->alloc = initlen;\n" +
        "            *fp = type;\n" +
        "            break;\n" +
        "        }\n" +
        "        case SDS_TYPE_32: {\n" +
        "            SDS_HDR_VAR(32,s);\n" +
        "            sh->len = initlen;\n" +
        "            sh->alloc = initlen;\n" +
        "            *fp = type;\n" +
        "            break;\n" +
        "        }\n" +
        "        case SDS_TYPE_64: {\n" +
        "            SDS_HDR_VAR(64,s);\n" +
        "            sh->len = initlen;\n" +
        "            sh->alloc = initlen;\n" +
        "            *fp = type;\n" +
        "            break;\n" +
        "        }\n" +
        "    }")
        .interpretation("类型不同创建不同的结构");
复制代码

字节长度不同创建的结构大小也不同,以 shshdr8 为例

Code.SLICE.source("struct __attribute__ ((__packed__)) sdshdr8 {\n" +
  "    uint8_t len; /* 已经使用的长度 */\n" +
  "    uint8_t alloc; /* 分配的长度 */\n" +
  "    unsigned char flags; /* 3 lsb of type, 5 unused bits */\n" +
  "    char buf[];\n" +
  "};")
  .interpretation("len表示使用了的长度,alloc表示分配的空间长度,flags的最低三个bit用来表示header的类型,类型比如 sdshdr8")
  .interpretation("1:uint8_t指的是 unsigned char ,大小为1字节 char buf[]本身不计算大小,只是真实数据存储的时候,会在 buf最后添加 1个 \0,为了和C做兼容,方便利用C的一些函数")
  .interpretation("2:__attribute__ ((__packed__)) 是为了告诉编译器,以紧凑的方式存放,不做对齐,redis这样做方便获取数据,比如要拿到flag只需要获取 buf的前一个地址即可");
复制代码

不同的结构,header 占据空间也就不一样

总结

在读到set命令之后,对于传进来的数据会转换成redisObject,而根据string value长度的不同使用不同的编码,同时存储的结构也会不一样,以达到优化内存的目的

附录


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

编程珠玑(第二版)

编程珠玑(第二版)

[美] Jon Bentley / 谢君英、石朝江 / 中国电力出版社 / 2004-4 / 28.00元

《编程珠玑(第2版)》是计算机科学方面的经典名著。书的内容围绕程序设计人员面对的一系列实际问题展开。作者Jon Bentley 以其独有的洞察力和创造力,引导读者理解这些问题并学会解决方法,而这些正是程序员实际编程生涯中至关重要的。一起来看看 《编程珠玑(第二版)》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

SHA 加密
SHA 加密

SHA 加密工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换