Redis 核心数据结构入门指南：String、Hash、List 全解析

原创 2025-07-14 10:04:16编程技术

836

Redis 作为高性能的内存数据库，凭借其丰富的数据结构和原子性操作，在缓存、消息队列、分布式锁等场景中广泛应用。对于初学者而言，掌握 String、Hash、List 三种核心数据结构是深入理解 Redis 的关键。本文ZHANID工具网将从底层原理、操作命令、应用场景三个维度展开解析，帮助读者快速掌握这些数据结构的使用精髓。

一、String：最基础却最强大的数据容器

1.1 动态字符串的底层实现

Redis 的 String 类型采用动态字符串（SDS）结构，其设计灵感源自 Java 的 ArrayList：

预分配冗余空间：内部维护 capacity（总容量）和 len（实际长度）两个属性，capacity 通常大于 len。当字符串长度小于 1MB 时，扩容策略为加倍现有空间；超过 1MB 后，每次扩容仅增加 1MB。
二进制安全：可存储图片、序列化对象等二进制数据，最大长度为 512MB。
编码优化：根据内容自动选择编码方式：

int：存储 8 字节长整型。
embstr：短字符串（≤39 字节）使用连续内存存储。
raw：长字符串（>39 字节）分离存储元数据和内容。

1.2 核心操作命令

命令	示例	说明
`SET key value`	`SET user:1001 "Alice"`	设置键值对，覆盖已存在值
`GET key`	`GET user:1001`	获取键对应的值
`MSET/MGET`	`MSET name1 "Alice" age1 30`	批量设置/获取多个键值对
`INCR/DECR`	`INCR counter`	原子性自增/自减（仅限数字）
`EXPIRE`	`EXPIRE user:1001 3600`	设置键的过期时间（秒）
`SETNX`	`SETNX lock:resource true`	仅当键不存在时设置（用于分布式锁）

1.3 典型应用场景

缓存加速
将数据库查询结果序列化为 JSON 存入 String，例如：
```
SET user:1001 '{"name":"Alice","age":30}'
```
通过 GET 快速读取，减少数据库压力。
计数器系统
利用 INCR 实现原子性计数，例如统计页面访问量：
```
INCR page:views:home
```

分布式锁
通过 SETNX + EXPIRE 实现简单锁机制：

SETNX lock:order true    # 获取锁
EXPIRE lock:order 10    # 设置超时时间

限流控制
结合 INCR 和 EXPIRE 实现滑动窗口限流：

INCR user:1001:requests   # 请求计数
EXPIRE user:1001:requests 60 # 60秒后重置

二、Hash：对象存储的优雅方案

2.1 哈希表的双态存储

Redis 的 Hash 本质是 "String 的扩展"，采用键值对集合形式存储对象属性：

压缩列表（ZipList）
当字段数 ≤512 且每个字段值 ≤64 字节时，使用紧凑的连续内存存储。例如：
```
HSET user:1001 name "Alice" age 30
```
内部结构类似火车车厢：<zlbytes><zltail><zllen><entry>...<entry><zlend>，通过前缀编码减少内存开销。
哈希表（Dict）
数据量超过阈值时自动转换为哈希表，由两个哈希表（ht[0] 和 ht[1]）组成，支持渐进式 rehash：

扩容条件：负载因子（used/size）>1.0 或执行 BGSAVE/BGREWRITEAOF 期间负载因子 >0.75。
渐进式迁移：每次增删改查操作迁移一个 bucket，避免阻塞主线程。

2.2 核心操作命令

命令	示例	说明
`HSET`	`HSET user:1001 name "Bob"`	设置单个字段值
`HMSET`	`HMSET user:1001 age 31 email "bob@example.com"`	批量设置字段值
`HGET`	`HGET user:1001 name`	获取单个字段值
`HGETALL`	`HGETALL user:1001`	获取所有字段值（慎用大数据量）
`HINCRBY`	`HINCRBY user:1001 score 10`	原子性增减数值字段
`HSCAN`	`HSCAN user:1001 0 MATCH "name*" COUNT 10`	分批迭代字段（避免阻塞）

2.3 典型应用场景

用户信息存储
替代多个 String 键（如 user:1001:name、user:1001:age），使用单个 Hash 存储：
```
HMSET user:1001 name "Alice" age 30 email "alice@example.com"
```
优势：

减少键数量，降低内存开销。
支持部分更新（如仅修改 age 字段）。

购物车实现
以用户 ID 为键，商品 ID 为字段，数量为值：

HSET cart:user1001 product:2001 2 # 添加2件商品
HINCRBY cart:user1001 product:2001 1 # 增加1件

统计维度聚合
记录商品按渠道的销量：

HINCRBY product:sales:1001 channel_a 10
HINCRBY product:sales:1001 channel_b 5

通过 HGETALL 获取所有渠道销量：

HGETALL product:sales:1001
# 返回: ["channel_a","10","channel_b","5"]

三、List：有序数据的灵活操作

3.1 快速链表的底层演进

Redis 的 List 类型经历了从 压缩列表（ZipList） 和 双向链表（LinkedList） 到 快速链表（QuickList） 的优化：

ZipList
3.2 版本前用于小数据量存储，所有元素紧凑排列在连续内存中。插入/删除可能导致连锁更新（修改一个元素触发后续元素内存重新分配）。
LinkedList
由独立的 listNode 结构组成，每个节点包含 prev 和 next 指针。内存占用高（每个节点需额外存储两个指针），但插入/删除操作复杂度为 O(1)。
QuickList
3.2 版本后统一采用的结构，结合 ZipList 和 LinkedList 的优势：

每个节点是一个 ZipList，存储多个元素。
通过 list-max-ziplist-size 配置每个 ZipList 的最大元素数（默认 -2，表示 8KB）。
支持双向遍历和范围查询。

3.2 核心操作命令

命令	示例	说明
`LPUSH/RPUSH`	`LPUSH queue "task1"`	从头部/尾部插入元素
`LPOP/RPOP`	`RPOP queue`	从尾部/头部移除元素
`LRANGE`	`LRANGE queue 0 -1`	获取指定范围内的元素
`BLPOP/BRPOP`	`BLPOP queue 5`	阻塞式弹出（超时时间5秒）
`LTRIM`	`LTRIM queue 0 9`	裁剪列表，保留指定范围内的元素
`RPOPLPUSH`	`RPOPLPUSH queue1 queue2`	尾部弹出并头部推入（用于任务重试）

3.3 典型应用场景

消息队列
生产者通过 LPUSH 发布任务，消费者通过 BRPOP 阻塞获取：

# 生产者
LPUSH task_queue '{"id":1,"action":"send_email"}'

# 消费者
BRPOP task_queue 0 # 阻塞等待，0表示无限等待

最新消息时间线
微博、朋友圈等场景利用 LPUSH 将新消息插入列表头部：

LPUSH user:1001:timeline '{"content":"Hello","time":1625097600}'
LRANGE user:1001:timeline 0 9 # 获取最近10条消息

任务重试机制
通过 RPOPLPUSH 实现失败任务的重试队列：

# 初始队列
LPUSH main_queue 'task1' 'task2'

# 处理任务（失败时移至重试队列）
RPOPLPUSH main_queue retry_queue

有限历史记录
结合 LTRIM 限制列表长度，例如保留用户最近 100 条操作日志：

LPUSH user:1001:logs '{"action":"login","time":1625097600}'
LTRIM user:1001:logs 0 99 # 保留前100条

四、数据结构选型指南

4.1 性能对比

数据结构	插入/删除	范围查询	内存占用	适用场景
String	O(1)	O(1)	低	简单键值对、计数器
Hash	O(1)	O(N)	中	对象存储、部分更新
List	O(1)	O(N)	中	有序数据、消息队列

4.2 避坑指南

避免大 Key

Hash：单个 Hash 字段数超过 10,000 或单个字段值超过 10KB 时，性能显著下降。解决方案：拆分为多个 Hash 或使用 Zset 分页。
List：单个 List 元素数超过 100,000 时，LRANGE 等操作可能导致阻塞。解决方案：分片存储或改用 Sorted Set。

慎用 HGETALL
大数据量 Hash 使用 HGETALL 会阻塞主线程，改用 HSCAN 分批迭代：
```
HSCAN user:1001 0 MATCH "name*" COUNT 100
```
合理配置阈值
通过 hash-max-ziplist-entries 和 hash-max-ziplist-value 调整 Hash 的编码切换阈值，平衡内存和性能。