Merge pull request #22 from zeekling/dict_intro

dict 学习
This commit is contained in:
LingZhaoHui 2022-12-30 22:40:50 +08:00 committed by GitHub
commit 09909691ba
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
3 changed files with 67 additions and 1 deletions

View File

@ -1,5 +1,33 @@
# 简介
字典是redis数据库最基本的结构其本质结构是hash用来存储键值对的一种数据结构Redis本身就是K-V数据库
整个数据库就是用字典存储的对于Redis数据库的增、删、改、查操作实际上都是对字典结构的操作。
## hash函数
对于字典来讲计算key的hash比较重要下面是Redis内核里面使用的计算的hash方法: [siphash](./siphash.md)
```c
static uint8_t dict_hash_function_seed[16];
uint64_t dictGenHashFunction(const void *key, size_t len) {
return siphash(key,len,dict_hash_function_seed);
}
```
`dictGenHashFunction`函数的主要作用是将任意长度的字符串计算siphash的值siphash是一个无符号整型数据。
在Redis当中将任意key转换为无符号整数类型当作hash结构的下表使用。
## hash冲突
Redis使用hash结构保存数据那么无法忽略的一个问题就是hash冲突。和hashmap一样在键冲突的K-V串联成一个
list列表如下图所示:
![pic](./dict0001.png)
一般情况下,根据键查找值分为两步:
- 键通过计算hash值获取索引值根据索引值找到对应的元素。
- 判断元素中的键与查找的键是否相等,相等则返回值,否则继续判断下一个元素。
# 基本操作

BIN
dict/dict0001.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 107 KiB

38
dict/siphash.md Normal file
View File

@ -0,0 +1,38 @@
# siphash算法
SipHash是一个伪随机函数PRF系列为短消息的速度而优化。SipHash算法是由Jean-Philippe Aumasson和Daniel J. Bernstein
在2012年设计的可以对hash的DoS攻击的进行防御。
SipHash算法的特点
- 与以前的加密算法相比如基于通用散列的MACS在短消息上更简单、更快速。
- 在性能上与不安全的非加密算法如fhhash具有竞争力。
- 密码学上是安全的,尽管领先的密码学家进行了多个密码分析项目,没有发现弱点。
- 经过实战检验在操作系统Linux内核、OpenBSD、FreeBSD、FreeRTOS、语言Perl、Python、Ruby等
OpenSSL libcrypto、Sodium等和应用程序Wireguard、Redis等中成功整合。
作为一个安全的伪随机函数又称有密钥的哈希函数SipHash也可以作为一个安全的消息认证码MAC
但SipHash不是通用的无密钥散列函数如BLAKE3或SHA-3意义上的散列。因此SipHash应始终与秘密密钥一起使用以确保安全。
# 变体
默认的SipHash是SipHash-2-4它接受一个128位的密钥进行2轮压缩4轮最终确定并返回一个64位的标签。
变体可以使用不同的轮数。例如我们提出SipHash-4-8作为一个保守的版本。
以下版本没有在论文中描述,但为了满足应用的需要而设计和分析的。
- SipHash-128返回一个128位的标签而不是64位。有指定轮数的版本是SipHash-2-4-128SipHash4-8-128以此类推。
- HalfSipHash使用32位的字而不是64位接受64位的密钥并返回32位或64位的标签。例如HalfSipHash-2-4-32有2个压缩轮4个终结轮并返回一个32位标签。
# 安全性
(Half)SipHash-c-dc≥2d≥4有望为任何具有相同密钥和输出大小的函数提供最大的PRF安全性。
标准的PRF安全目标允许攻击者访问由攻击者自适应选择的信息上的SipHash输出。
安全性受到密钥大小的限制SipHash为128位因此搜索2s密钥的攻击者有2s-128的机会找到SipHash密钥。
安全性也受到输出大小的限制。特别是当SipHash被用作MAC时如果t是该标签的字节级别大小盲目尝试2s标签的攻击者将以2s-t的概率成功。