Redis系列(七)底层数据结构之跳跃表

栏目: IT技术 · 发布时间: 6年前

内容简介：Redis 已经是大家耳熟能详的东西了，日常工作也都在使用，面试中也是高频的会涉及到，那么我们对它究竟了解有多深刻呢？我读了几本 Redis 相关的书籍，尝试去了解它的具体实现，将一些底层的数据结构及实现原理记录下来。本文将介绍 Redis 中底层的

前言

Redis 已经是大家耳熟能详的东西了，日常工作也都在使用，面试中也是高频的会涉及到，那么我们对它究竟了解有多深刻呢？

我读了几本 Redis 相关的书籍，尝试去了解它的具体实现，将一些底层的数据结构及实现原理记录下来。

本文将介绍 Redis 中底层的 skiplist（跳跃表） 的实现方法。它是 Redis 中有序集合键底层实现之一。

Redis系列(七)底层数据结构之跳跃表

可以看到图中，当我在 zsetkey 中放入了两个简单的值时，编码为 ziplist , 而当我插入一个较长的值，zset 的编程方式成为了 skiplist .

对于跳跃表这个数据结构，其底层实现原理及代码实现，本文就不细讲了，如果不太清楚的读者可以看一下这个文章跳表的原理 %E7%9A%84%E5%8E%9F%E7%90%86%E5%8F%8AConcurrentSkipListMap%E7%9A%84%E6%BA%90%E7%A0%81%E5%AD%A6%E4%B9%A0/#%E6%A6%82%E8%BF%B0), 或者自行 google 了解。

本文仅对 Redis 中跳跃表的实现做一个学习。

定义

首先让我们来看一下，skiplist 的定义：

typedef struct zskiplist{
    // 表头结点和尾节点
    struct zskiplistNode *header, *tail;
    // 表中节点的数量
    unsigned int length;
    // 表中层数最大的节点的层数
    int level;
} zskiplist;

这几个属性比较简单，其中 header, tail 可以在 O(1) 的时间复杂度内定位到跳跃表的头部和尾部， length 可以在 O(1) 时间复杂度内得到跳跃表的长度。 level 可以知道当前跳跃表最高的层，从而开始从高向低进行查找。

其中 skiplistNode 的节点的定义为：

typedef struct zskiplistNode{
    struct zskiplistLevel{
        // 前进指针
        struct zskiplistNode *forward;
        // 跨度
    } level[];
    // 后退指针
    struct zskiplistNode *backward;
    // 分值
    double score;
    // 成员对象
    robj *obj;
} zskiplistNode;

这个节点的定义有点东西的。

如果了解 Java 中的 ConcurrentSkipListMap 的实现，或者看了上面我的那篇文章的话，就会知道，在 Java 中，一个所谓的 节点（或者叫索引） 是有两个指针的，一个指向右侧的下一个索引，一个指向自己的下一层索引。

但是 Redis 不是这么实现的，在上面的定义中，可以看到 zskiplistLevel 这个结构是一个数组，用一个数组来保存， 本节点，以及本节点在所有层的索引 .

每个索引中，有两个属性，

forward

指向右侧的指针，可以在当前层，继续向右走。

跨度

这个属性设计的很巧妙，可以用它来计算当前节点在跳跃表中的一个排名，这就 zset 提供了查看排名的功能。

backward

后退的指针，如果在高层索引向右走的太多了，可以用后退指针来向后退。

score and obj

这两个属性用来保存当前节点的真正值以及分值。

层级问题

在 Java 中的 ConcurrentSkipListMap 的实现中，索引每一次向上升级或者不升级，都是随机的，因此：

一个节点是否是一级索引的概率是 50%.
是否是二级索引的概率是 25%.

...

而在 Redis 中，新添加一个节点时，会给该节点随机一个索引层数，而且概率是 25%. 之后将该节点的各层索引与左右的索引相链接。

由于概率是 25%, 因此 Redis 的跳跃表相对于 Java 中的跳跃表，结构更加扁平一些，在查找的时候，在同级索引上可能需要多查询几个。

也是因为结构扁平，因此索引的数量并不是完全的等同于节点数，额外的内存占用只有 50%. 可以为 Redis 服务器节省一点内存。

顺序问题

我们知道，在 zset 中，是可以存储分数一样的值的，此时内部如何存储？直接进行无序存储吗？

如果是这样，当一个 zset 中，所有元素的分值都一样，跳跃表表的性能就会退化成链表的性能吗？

不是这样的，Redis 除了按照分值排序之外，还会按照字符串的字典序来存储。

排名问题

前面提到了 跨度 这个属性，当我们需要查找某个元素的排名时，跳跃表首先开始一次查询过程，找到该节点时，也可以找到从顶层索引找到该节点的 查找路径 , 将路径上的所有节点的跨度值相加就是该节点的排名。

总结

Redis 的跳跃表，和其他语言实现的跳跃表，总体思路一样，在实现方式上有一些自己的小技巧。

跳跃表示有序集合键的底层实现之一，表中元素按照 score 大小进行排序，当 score 相同时，元素按照字符串的字典大小进行排序。

相比于 Java 的跳跃表，Redis 的跳跃表的索引层级更加扁平，可以节省一些内存。

参考文章

《Redis 的设计与实现（第二版）》

《Redis 深度历险：核心原理和应用实践》

完。

联系我

最后，欢迎关注我的个人公众号【呼延十】，会不定期更新很多后端工程师的学习笔记。

也欢迎直接公众号私信或者邮箱联系我，一定知无不言，言无不尽。

Redis系列(七)底层数据结构之跳跃表

以上皆为个人所思所得，如有错误欢迎评论区指正。

欢迎转载，烦请署名并保留原文链接。

联系邮箱：huyanshi2580@gmail.com

更多学习笔记见个人博客或关注微信公众号 < 呼延十 >------> 呼延十

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Android 源码设计模式解析与实战

何红辉、关爱民 / 人民邮电出版社 / 2015-11 / 79.00元

本书专门介绍Android源代码的设计模式，共26章，主要讲解面向对象的六大原则、主流的设计模式以及MVC和MVP模式。主要内容为：优化代码的首步、开闭原则、里氏替换原则、依赖倒置原则、接口隔离原则、迪米特原则、单例模式、Builder模式、原型模式、工厂方法模式、抽象工厂模式、策略模式、状态模式、责任链模式、解释器模式、命令模式、观察者模式、备忘录模式、迭代器模式、模板方法模式、访问者模式、中介......一起来看看《Android 源码设计模式解析与实战》这本书的介绍吧!

码农工具

Redis系列(七)底层数据结构之跳跃表

前言

定义

层级问题

顺序问题

排名问题

总结

参考文章

联系我

以上皆为个人所思所得，如有错误欢迎评论区指正。

欢迎转载，烦请署名并保留原文链接。

联系邮箱：huyanshi2580@gmail.com

Android 源码设计模式解析与实战

URL 编码/解码

UNIX 时间戳转换

正则表达式在线测试