redis_study/README.md

18 KiB
Raw Permalink Blame History

查看英文版,请查看:README_EN.md

这个README.md知识提供快速开始的文档。其他详细信息可以查看redis.io

什么是Redis

Redis是一个内存结构数据库。这意味着Redis通过一组命令提供对可变数据结构的访问这些命令是使用带有TCP套接字和简单协议的 服务器-客户机模型发送的。因此不同的进程可以以共享的方式查询和修改相同的数据结构。

Redis中实现的数据结构有几个特殊属性

  • Redis会将数据存储在磁盘上数据总是被服务和修改到服务器内存中。这意味着Redis速度很快但也不是易失性的。
  • 数据结构的实现强调内存效率因此与使用高级编程语言建模的相同数据结构相比Redis中的数据结构可能使用更少的内存。
  • Redis提供了许多在数据库中很自然的特性比如复制、可调的持久性级别、集群、高可用性。

另一个很好的例子是将Redis看作是memcached的一个更复杂的版本其中的操作不仅仅是set和get而是处理复杂数据类型如列表、 集合、有序数据结构等)的操作。

如果您想了解更多信息,可以点击下面链接:

构建Redis

Redis可以在Linux、OSX、OpenBSD、NetBSD、FreeBSD上编译和使用。我们支持big-endian和little-endian体系结构以及32位和64位 系统。

它可以在Solaris派生的系统例如SmartOS上编译但是我们对这个平台的支持是最好的Redis不能保证在Linux、OSX和*BSD中工作 得那么好。

编译命令

make

要使用TLS支持进行构建您需要OpenSSL开发库例如Debian/Ubuntu上的libssl dev并运行

make BUILD_TLS=yes

您可以使用以下方法运行32位Redis二进制文件:

make 32bit

在构建Redis之后最好使用以下方法进行测试

make test

如果构建了TLS请在启用TLS的情况下运行测试您需要安装tcl TLS

./utils/gen-test-certs.sh
./runtest --tls

修复依赖项或缓存生成选项的生成问题

Redis有一些包含在deps目录中的依赖项。即使依赖项源代码中的某些内容发生更改make也不会自动重新生成依赖项。

使用git pull更新源代码或以任何其他方式修改依赖关系树中的代码时请确保使用以下命令以便真正清理所有内容并从头开始重建

make distclean

这将清除jemallocluahiredislinenoise。 另外如果强制某些生成选项如32位目标、无C编译器优化用于调试目的和其他类似的生成时选项则这些选项将被无限期缓存 直到发出makedistclean命令。

修复生成32位二进制文件的问题

如果在用32位目标构建Redis之后需要用64位目标重新构建它或者反过来您需要在Redis发行版的根目录中执行make distclean

如果在尝试构建32位的Redis二进制文件时出现构建错误请尝试以下步骤

  • 安装包libc6-dev-i386也可以尝试g++-multilib
  • 尝试使用以下命令行 makecflags=“-m32-march=native”LDFLAGS=“-m32” 代替 make32bit

内存分配

通过设置MALLOC环境变量可以在构建Redis时选择非默认内存分配器。Redis在默认情况下是针对libc malloc编译和链接的但 jemalloc是Linux系统上的默认设置。之所以选择此默认值是因为jemalloc被证明比libc malloc具有更少的碎片问题。

强制使用libc编译,请使用:

 make MALLOC=libc

强制使用jemalloc编译,请使用:

make MALLOC=jemalloc

显示详细构建信息

默认情况下Redis将生成用户友好的彩色输出。如果要查看更详细的输出请使用以下命令

make V=1

运行Redis

要使用默认配置运行Redis执行下面命令

cd src
./redis-server

如果你想提供redis.con您必须使用其他参数配置文件的路径来运行它

cd src
./redis-server /path/to/redis.conf

通过使用命令行直接将参数作为参数传递可以更改Redis配置。示例

./redis-server --port 9999 --replicaof 127.0.0.1 6379
./redis-server /etc/redis/6379.conf --loglevel debug

所有redis.conf的配置参数也支持使用命令行作为参数使用完全相同的名称。

Redis 支持TLS

请查看TLS.md文件获取有关如何将Redis与TLS一起使用的详细信息。

使用Redis

您可以使用redis cli来连接redis。启动一个redis服务器实例然后在另一个终端上尝试以下操作

% cd src
% ./redis-cli
redis> ping
PONG
redis> set foo bar
OK
redis> get foo
"bar"
redis> incr mycounter
(integer) 1
redis> incr mycounter
(integer) 2
redis>

您可以在中找到所有可用命令的列表:http://redis.io/commands.

安装Redis

要将Redis二进制文件安装到/usr/local/bin中只需使用

make install

如果要使用其他目标,可以使用make prefix=/some/other/directory install

make install将只在系统中安装二进制文件但不会在适当的位置配置init脚本和配置文件。如果你只想玩一点Redis这是不需要的 但是如果你是在一个生产系统中正确地安装它我们有一个脚本为Ubuntu和Debian系统这样做

cd utils
./install_server.sh

注意:install_server.sh不支持在Mac OSX上面运行,只支持Linux

该脚本将解决您一些问题并将设置您所需的一切以便将Redis作为后台守护程序正常运行该后台守护程序将在系统重新启动时 重新启动。

您可以使用名为/etc/init.d/Redis_<portnumber>的脚本来停止和启动Redis例如/etc/init.d/Redis_6379

代码贡献

注意 通过以任何形式向Redis项目贡献代码包括通过Github发送请求、通过私人电子邮件或公共讨论组发送代码片段或补丁 您同意根据BSD许可条款发布代码您可以在Redis源代码发行版中包含的COPYING中找到该许可证。

有关详细信息,请参阅此源发行版中的CONTRIBUTING

Redis 内部结构

如果您正在阅读这篇自述那么您很可能是在Github页面前面或者您刚刚解除了Redis发行tar-ball的限制。在这两种情况下您基本上 都离源代码只有一步之遥所以这里我们将解释Redis源代码的布局、每个文件中的基本内容、Redis服务器内部最重要的功能和结构等 等。我们将所有的讨论保持在一个高水平上,而不是深入到细节,因为这个文档将是巨大的,否则我们的代码库将不断变化,但一个总体 的想法应该是一个很好的起点来理解更多。此外,大部分代码都有大量注释,并且易于理解。

源代码布局

Redis根目录只包含这个readme文件、调用src目录中实际Makefile的Makefile以及Redis和Sentinel的示例配置。您可以找到一些用于运行 Redis、Redis Cluster和Redis Sentinel单元测试的shell脚本这些测试在tests目录中实现。

根目录中有以下重要目录:

  • src: 包含Redis实现用C编写。
  • tests包含在Tcl中实现的单元测试。
  • deps包含Redis使用的库。编译Redis所需的一切都在这个目录中您的系统只需要提供libc、一个与POSIX兼容的接口和一个C编 译器。值得注意的是deps包含jemalloc的副本这是Linux下Redis的默认分配器。请注意在deps下还有一些事情是从Redis项目 开始的但是对于这些项目主存储库不是antirez/Redis。

还有一些目录但它们对我们的目标并不重要。我们将主要关注src其中包含Redis实现探索每个文件中都有什么。为了逐步揭示不同的复杂性层次文件的公开顺序是必须遵循的逻辑顺序。

注意最近Redis被重构了不少。函数名和文件名已更改因此您可能会发现此文档更接近于不稳定分支的反映。例如在Redis 3.0 中server.c和server.h文件名为Redis.c和Redis.h但总体结构是相同的。请记住所有新的开发和拉取请求都应该针对不稳定的分支执行。

server.h

理解程序如何工作的最简单的方法是理解它使用的数据结构。所以我们从Redis的主头文件开始它是server.h。

所有的服务器配置和一般的共享状态都是在一个名为server的全局结构中定义的类型为struct rediserver。该结构中的几个重要字段是

  • server.db是Redis数据库的数组其中存储数据。
  • server.commands:是命令列表。
  • server.clients:是连接到服务器的客户端的链接列表。
  • server.master:是一个特殊的客户机,如果实例是副本,则是主客户机。

还有很多其他的结构。大多数字段直接在结构定义内部进行注释。

另一个重要的Redis数据结构是定义客户机的结构。过去叫redisClient现在只叫client。结构有很多字段这里我们只展示主要字段

struct client {
    int fd;
    sds querybuf;
    int argc;
    robj **argv;
    redisDb *db;
    int flags;
    list *reply;
    char buf[PROTO_REPLY_CHUNK_BYTES];
    ... many other fields ...
}

client结构定义连接的客户端:

  • fd字段是客户机套接字文件描述符。
  • argc和argv使用客户端正在执行的命令填充以便实现给定Redis命令的函数可以读取参数。
  • querybuf对来自客户端的请求进行累加这些请求由Redis服务器根据Redis协议进行解析并通过调用客户端正在执行的命令的实现来执行。
  • reply和buf是动态和静态缓冲区用于累积服务器发送给客户机的响应。一旦文件描述符可写这些缓冲区就会以增量方式写入套接字。

正如您在上面的客户机结构中看到的命令中的参数被描述为robj结构。下面是完整的robj结构它定义了一个Redis对象

typedef struct redisObject {
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:LRU_BITS; /* lru time (relative to server.lruclock) */
    int refcount;
    void *ptr;
} robj;

基本上这个结构可以表示所有基本的Redis数据类型如字符串、列表、集合、排序集等等。有趣的是它有一个类型字段这样就可以 知道给定对象的类型以及refcount这样就可以在多个地方引用同一个对象而无需多次分配它。最后ptr字段指向对象的实际表示 形式,即使对于同一类型,它也可能有所不同,这取决于所使用的编码。

Redis对象在Redis内部被广泛使用但是为了避免间接访问的开销最近在很多地方我们只使用普通的动态字符串而不是包装在Redis对象中。

server.c

这是Redis服务器的入口点在这里定义main函数。以下是启动Redis服务器的最重要步骤。

  • initServerConfig():设置服务器结构的默认值。
  • initServer():分配操作所需的数据结构,设置侦听套接字,等等。
  • aeMain():启动侦听新连接的事件循环。

事件循环定期调用两个特殊函数:

  • serverCron():定期调用(根据服务器.hz必须从时间和频率方面检查客户机。
  • beforeSleep():每次触发事件循环时都会调用Redis为一些请求提供服务并返回到事件循环中。

在server.c中您可以找到处理Redis服务器其他重要事务的代码

  • call():用于在给定客户端的上下文中调用给定命令。
  • activeExpireCycle():通过EXPIRE命令处理带有生存时间设置的密钥的设备。
  • freeMemoryIfNeeded():当应执行新的write命令但根据maxmemory指令Redis内存不足时调用。
  • 全局变量redisCommandTable定义所有Redis命令指定命令的名称、实现该命令的函数、所需参数的数量以及每个命令的其他属性。

networking.c

这个文件定义了客户端、主机和副本的所有I/O功能在Redis中只是特殊的客户端

  • createClient():分配并初始化新客户端。
  • 分配并初始化一个新的客户命令实现使用addReply*()系列函数,以便将数据附加到客户机结构中,这些数据将作为对执行的给定命令的应答传输到客户端。
  • writeToClient():将输出缓冲区中挂起的数据传输到客户端,并由可写事件处理程序sendReplyToClient()调用。
  • readQueryFromClient():是可读的事件处理程序,并将从客户端读取的数据累积到查询缓冲区。
  • processInputBuffer():是根据Redis协议解析客户端查询缓冲区的入口点。一旦命令准备好被处理它就会调用在server.c中定义的processCommand以便实际执行该命令。
  • freeClient():取消分配、断开和删除客户端。

aof.c and rdb.c

从名称中可以猜到这些文件实现了Redis的RDB和AOF持久性。基于Redis的共享线程在同一个Redis线程上创建共享内存fork 模型。这个辅助线程将内存的内容转储到磁盘上。rdb.c使用它在磁盘上创建快照aof.c使用它在只追加的文件太大时执行aof重写。

在aof.c中的实现有附加的函数以便实现一个API该API允许命令在客户端执行命令时将新命令附加到aof文件中。

在server.c中定义的call函数负责调用将命令写入AOF的函数。

db.c

某些Redis命令操作特定的数据类型其他命令是通用的。通用命令的示例有DEL和EXPIRE。它们操作的是键而不是具体的值。所有这 些通用命令都在db.c中定义

此外db.c实现了一个API以便在Redis数据集上执行某些操作而不直接访问内部数据结构。

db.c中最重要的函数在许多命令实现中使用如下

  • lookupKeyRead和lookupKeyWrite用于获取指向与给定键关联的值的指针如果该键不存在则为NULL。
  • dbAdd和它的高级对应setKey在Redis数据库中创建一个新的键。
  • dbDelete删除键及其关联值。
  • emptyDb删除整个单个数据库或定义的所有数据库。

文件的其余部分实现了向客户机公开的通用命令。

object.c

已经描述了定义Redis对象的robj结构。在object.c中有所有在基本级别操作Redis对象的函数比如分配新对象、处理引用计数等等。 此文件中的重要功能:

  • incrRefcount和decrefCount用于递增或递减对象引用计数。当它降到0时对象最终被释放。
  • createObject分配新对象。还有一些专门的函数来分配具有特定内容的字符串对象如createStringObjectFromLongLong和类似函数。

此文件还实现OBJECT命令。

replication.c

这是Redis中最复杂的文件之一建议您在对其余代码库有一点熟悉之后再使用它。在这个文件中实现了Redis的master和replica角色。

这个文件中最重要的函数之一是replicationFeedSlaves它向表示连接到主服务器的副本实例的客户机写入命令以便副本可以获 得客户端执行的写入操作:这样,它们的数据集将与主服务器中的数据集保持同步。

此文件还实现SYNC和PSYNC命令这些命令用于在主服务器和副本之间执行第一次同步或在断开连接后继续复制。

Other C files

  • t_hash.c、t_list.c、t_set.c、t_string.c、t_zset.c和t_stream.c包含Redis数据类型的实现。它们实现一个API来访问给定的数据 类型,而客户机命令实现这些数据类型。
  • ae.c实现了Redis事件循环它是一个自包含的库易于阅读和理解。
  • sds.c是Redis字符串库详细查看https://github.com/antirez/sds
  • 与内核公开的原始接口相比anet.c是一个以更简单的方式使用POSIX网络的库。
  • dict.c是一个非阻塞哈希表的实现它可以递增地重新计算。
  • c实现Lua脚本。它完全独立于Redis实现的其余部分并且非常简单可以理解您是否熟悉luaapi。
  • c实现Redis集群。在非常熟悉Redis代码库的其余部分之后这可能是一个不错的只读版本。如果你想读cluster.c一定要读Redis cluster规范

Anatomy of a Redis command

所有Redis命令的定义方式如下

void foobarCommand(client *c) {
    printf("%s",c->argv[1]->ptr); /* Do something with the argument. */
    addReply(c,shared.ok); /* Reply something to the client. */
}

然后在命令表的server.c中引用该命令

{"foobar",foobarCommand,2,"rtF",0,NULL,0,0,0,0,0},

在上面的示例中2是命令接受的参数数而“rtF”是命令标志如server.c中的命令表顶部注释中所述。

命令以某种方式运行后它将一个应答返回给客户机通常使用addReply或networking.c中定义的类似函数。

Redis源代码中有大量的命令实现可以作为实际命令实现的示例。编写一些玩具命令是熟悉代码库的一个很好的练习。

还有许多其他的文件没有在这里描述但它是没有用的涵盖一切。我们只想帮助你迈出第一步。最终您将在Redis代码库中找到自己的方法-