手写Redis服务端，从设计者的角度聊一聊Redis本身

石杉的架构笔记

于 2022-01-17 09:44:16 发布

阅读量308

点赞数

CC 4.0 BY-SA版权

文章标签：字符串 redis java 分布式 socket

原文链接：https://mp.weixin.qq.com/s?__biz=MzU0OTk3ODQ3Ng==&mid=2247522629&idx=1&sn=1c8e758b83bbf9172e704018f2f7858f&chksm=fba57146ccd2f8503a6a771212836e0784bdb9898e544b27e1c56b7ea7353a80ab0043eb16cd&scene=126&&sessionid=0

本文分享了作者使用Java重写Redis的过程及心得。介绍了基于Netty的通讯原理、RESP协议细节，以及如何实现Redis命令处理、数据结构存储和AOF持久化等功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

「关注“石杉的架构笔记”，大厂架构经验倾囊相授 」

点击图片查看详情

【文章来源】https://sourl.cn/mqFYeU

零，起因

我为什么要造redis这个轮子？
  1 破除对redis神秘感。
  2 “基础服务中台”的同事们在开会讨论redis云，以及redis代理。
  3 开一个redis资源并不是容易事，为什么不可以不可以写成java直接推送到未来云上，简单方便。
以这个思路我开始使用业余时间研究了redis的tcp通讯原理与redis命令，出发点是写一个redis云代理之类的云管理软件，但是还是忍不住写成了java版的redis，本文章主要分享redis的编写心路历程。

redis通讯与 Netty

tcp

连到Redis服务器的客户端建立了一个到6379端口的TCP连接。

虽然RESP在技术上不特定于TCP，但是在Redis的上下文中，该协议仅用于TCP连接（或类似的面向流的连接，如unix套接字）。

使用netty作为通讯框架。

协议

Redis客户端和服务器端通信使用名为 RESP (REdis Serialization Protocol) 的协议。虽然这个协议是专门为Redis设计的，它也可以用在其它 client-server 通信模式的软件上。

RESP 协议在Redis1.2被引入，直到Redis2.0才成为和Redis服务器通信的标准。这个协议需要在你的Redis客户端实现。

RESP 是一个支持多种数据类型的序列化协议：简单字符串（Simple Strings）,错误（ Errors）,整型（ Integers）, 大容量字符串（Bulk Strings）和数组（Arrays）。

RESP在Redis中作为一个请求-响应协议以如下方式使用：

客户端以大容量字符串RESP数组的方式发送命令给服务器端。服务器端根据命令的具体实现返回某一种RESP数据类型。在 RESP 中，数据的类型依赖于首字节：

单行字符串（Simple Strings）：响应的首字节是 "+" 错误（Errors）：响应的首字节是 "-" 整型（Integers）：响应的首字节是 ":" 多行字符串（Bulk Strings）：响应的首字节是"$" 数组（Arrays）：响应的首字节是 "*"

另外，RESP可以使用大容量字符串或者数组类型的特殊变量表示空值，下面会具体解释。RESP协议的不同部分总是以 "\r\n" (CRLF) 结束。字符串 "foobar" 编码如下:

"$6\r\nfoobar\r\n"

实际redis命令是什么样的，比如 SET lhjljh lhjkjhkh

*3\r\n$3\r\nSET\r\n$6\r\nlhjljh\r\n$8\r\nlhjkjhkh

编解码

由于RESP天然是面向处理命令的，所以没办法直接把redis消息像grpc或者dubbo那样直接序列化和反序列化消息。

并且每个内容限定了长度，很适合做成及时序列化、零拷贝，直接针对输入流做反序列化和序列化，这一点与Protostuff序列化协议的设计很类似。所以序列化直接将服务端接收的流直接转成值。

编解码的实体类直接加入redis server 的处理某一个长连接tcp客户端的管道上。

如果有兴趣研究可以看c语言原版的源码分析视频：毕站redis源码分析视频（https://sourl.cn/DTZjLU）。

命令处理

将消息解码成RESP，还需要将RESP转为Command对象，这里因为是java语言，方法与类绑定，编写上和理解上会更加容易。但是会增加一些开销。

redis 的数据结构

底层主结构

底层主树使用跳表ConcurrentSkipListMap实现，没用hash类map的原因是服务端是集群后，客户端可能使用hash路由，会导致服务端严重的hash冲突，性能大打折扣。

key为封装的“String”，重写了equals方法避免相同的key但是在jvm中指针不同。

value是一个接口，实现类是redis的五大基本类型，所有数据类型都包含超时时间。

key

用封装的值做value的原因是方便统一管理

list

底层使用LinkedList的原因是LinkedList实现了多种接口，实现各种命令直接调用其现成实现的方法即可

set

底层使用HashSet，redis里的set没有多特殊。

hash

底层使用HashMap，这里和开头说的HashMap不冲突。

为什么不用跳表？

压缩列表很巧妙，大抵的意思就是将通信收到的数组直接填充到list中，将list直接按照次序直接当map使用，主要是0拷贝的思想，无需创建新资源，性能极高，但注意压缩列表与压缩无关。感兴趣可以查看连接：redis 压缩列表(https://sourl.cn/2HMxuY)