Kafka vs RabbitMQ vs Redis：消息中间件全面对比与选型指南

一、各中间件消息流转全过程
- Kafka 消息流转全过程（含机制详解）
- - 1. 核心组件
  - 2. 流程详解
- RabbitMQ 消息流转全过程（含机制详解）
- - 1. 核心组件
  - 2. 流程详解
- Redis 消息流转全过程（包含 Pub/Sub 与 Streams）
- - 1. 模式对比
  - 2. Pub/Sub 模式流程
  - 3. Streams 模式流程（推荐用于消息队列）
- 流程对比
二、核心特性对比
- 特性详解
三、性能与应用场景对比
- 典型应用场景
四、选型决策关键点（含典型应用场景）
五、使用与最佳实践概览
六、结论：没有“最好的中间件”，只有“最合适的工具”
- ✅ 选择 Kafka，当你需要
- ✅ 选择 RabbitMQ，当你需要
- ✅ 选择 Redis（Pub/Sub / Streams），当你需要
- 🧠 最终建议
- 🏁 总结一句话

在现代分布式系统架构中，消息中间件扮演着异步通信、系统解耦、流量削峰和保证最终一致性的关键角色。Apache Kafka、RabbitMQ和Redis是三种广泛采用但定位和特性迥异的解决方案。

本文将深入剖析它们的消息流转全过程、核心特性、适用场景、使用方法及各自的优势，为技术选型提供清晰依据。

在这里插入图片描述

一、各中间件消息流转全过程

以下是 Kafka、RabbitMQ 和 Redis 在消息流转过程中所涉及的详细全过程，涵盖关键组件、交互流程及机制解释，帮助你深入理解三者的工作机制和区别。

Kafka 消息流转全过程（含机制详解）

1. 核心组件

组件	说明
Producer	消息生产者，将消息发送至 Kafka 集群。
Broker	Kafka 节点，负责接收、存储、分发消息。
Topic	消息分类主题，逻辑上的消息队列。
Partition	Topic 下的子队列，支持并行写入/消费，确保分区内顺序性。
Consumer	消息消费者，从 Kafka 中拉取消息。
Consumer Group	多个消费者构成的组，每个分区只会被组内一个消费者消费（负载均衡）。
Controller Broker	管理集群元数据、选举分区 Leader 的特殊 Broker。
ISR（In-Sync Replicas）	和 Leader 同步的副本集合，确保高可用和数据一致性。
Zookeeper/KRaft	集群管理服务，用于协调 Broker、Leader 选举等（Kafka 2.x 及早期使用 Zookeeper，Kafka 3.x+ 支持 KRaft 模式）。

2. 流程详解

在这里插入图片描述

步骤 1：生产者发送消息
- Producer 向某个 Topic 发送消息。
- 根据配置的分区策略（Partitioner），消息会被路由到指定分区（例如根据 key 的哈希或轮询）。
- 发送参数 acks 控制确认机制：
  - acks=0: 不等待确认。
  - acks=1: Leader 副本确认即可。
  - acks=all: 所有 ISR 副本确认才返回成功（最高可靠性）。
步骤 2：Broker 接收与持久化
- Leader Partition 先接收消息，写入本地磁盘（顺序写 + Page Cache）。
- 若配置了副本（Replica），Follower 从 Leader 拉取数据并同步。
- Leader 会维护一个 ISR 列表，只有同步完成的副本才在其中。
- Follower 落后过多（比如超过 replica.lag.time.max.ms）会被踢出 ISR。
步骤 3：Consumer 拉取消息
- Consumer 属于某个 Consumer Group，主动从分配的分区拉取数据（Pull 模式）。
- Kafka 不推送消息，避免消费者过载。
- 每个分区只会被组内一个消费者消费（除非共享消费逻辑）。
- 消费位移（Offset）由消费者自己控制，提交方式有：
  - 自动提交（enable.auto.commit=true），存在消息丢失风险。
  - 手动提交（commitSync / commitAsync），更安全。
步骤 4：消费位移管理
- 消费者处理完消息后将 Offset 提交到 Kafka 的专用 Topic (__consumer_offsets)。
- 支持精确控制消费进度，可用于恢复和重复消费。

补充机制：

重试机制：Producer 自动重试失败的发送。
幂等性和事务性：配置 enable.idempotence=true 避免重复写入；开启事务模式实现 Exactly Once 语义。
日志保留策略：基于时间（如 7 天）或大小（如 1GB）自动清理旧数据。
Controller Broker：协调 Leader 选举、分区重新分配等集群管理任务。

RabbitMQ 消息流转全过程（含机制详解）

1. 核心组件

组件	说明
Producer	消息生产者，负责发送消息到 Exchange。
Exchange	交换机，负责路由消息到一个或多个队列。类型有 Direct / Topic / Fanout / Headers。
Binding	绑定规则，连接 Exchange 与 Queue，决定消息路由规则。
Queue	队列，最终存储消息，供消费者消费。
Consumer	消费者，从 Queue 中拉取或接收消息（支持 Push）。
Virtual Host	类似数据库的命名空间，隔离不同逻辑环境。

2. 流程详解

在这里插入图片描述

步骤 1：Producer 发送消息至 Exchange
- Producer 使用协议（AMQP）连接到 RabbitMQ Server。
- Producer 指定：
  - Exchange 名称
  - Routing Key（用于匹配绑定）
  - 消息持久化设置（deliveryMode=2 表示持久化）
步骤 2：Exchange 路由消息
- 根据 Exchange 类型：
  - Direct：完全匹配 Routing Key。
  - Topic：支持通配符匹配（如 order.*.paid）。
  - Fanout：广播给所有绑定队列。
  - Headers：基于消息 Header 的键值对匹配。
- 消息投递到绑定（Binding）匹配的 Queue。
步骤 3：Queue 接收并缓存消息
- 消息到达 Queue，等待被消费。
- Queue 可设置 TTL、长度限制、死信转发策略等。
- 如果 Queue 不存在或无法投递：
  - 若设置了 mandatory=true，会触发 ReturnCallback 返回消息。
  - 否则消息被丢弃。
步骤 4：Consumer 接收消息
- RabbitMQ 推送（Push）消息到注册的消费者。
- 若设置 autoAck=false，则需消费者显式确认（Ack）：
  - Basic.Ack: 消费成功。
  - Basic.Nack/Reject: 消费失败，可设置是否重入队列（requeue=true/false）。
步骤 5：确认与重试机制
- 若消费者宕机、处理失败且未 Ack，RabbitMQ 会将消息重新入队。
- 可通过**死信队列（DLX）**机制处理失败消息：
  - 消息被拒绝、TTL 过期、队列满时，被转发至绑定的 DLX。

延迟队列方案

RabbitMQ 无原生延迟队列，需借助插件或组合方案：
- 设置 TTL + 死信队列实现延迟。
- 使用 rabbitmq_delayed_message_exchange 插件支持自定义延迟。

Redis 消息流转全过程（包含 Pub/Sub 与 Streams）

1. 模式对比

模式	特点
Pub/Sub	广播消息到所有订阅者，不持久化，高性能但不可靠。
Streams	类似 Kafka 日志结构，持久化，支持消费组，可靠性强。

2. Pub/Sub 模式流程

在这里插入图片描述

步骤 1：客户端订阅 Channel
- Consumer 执行命令：SUBSCRIBE my_channel，监听频道。
- Redis 为连接绑定该频道。
步骤 2：Producer 发布消息
- Producer 执行：PUBLISH my_channel "hello"。
- Redis 查找所有订阅该频道的客户端，并将消息立即广播。
- 特点：
  - 无存储，无重试，无确认。
  - 若无客户端订阅，消息会被直接丢弃。
  - 无消费顺序保证，适用于状态通知、事件推送等场景。

3. Streams 模式流程（推荐用于消息队列）

在这里插入图片描述

步骤 1：Producer 写入消息
- 命令：XADD mystream * key1 value1 key2 value2。
- 每条消息生成唯一 ID，按时间顺序排列。
步骤 2：创建消费组
- XGROUP CREATE mystream mygroup $ 创建消费组，从新消息开始消费。
步骤 3：消费者拉取消息
- 使用命令：XREADGROUP GROUP mygroup consumer-1 COUNT 10 BLOCK 1000 STREAMS mystream >
- 拉取尚未确认的消息，支持阻塞等待。
步骤 4：消费确认
- 消费成功后执行 XACK mystream mygroup message-id 进行确认。
- 未确认消息会保留在 PEL（Pending Entries List，待处理条目列表）中，可做重试。

补充机制：

支持消息持久化（依赖 Redis AOF/RDB）。
支持消息回溯（通过 ID 重读历史消息）。
支持消息修剪（XTRIM）限制内存占用。

流程对比

特性	Kafka	RabbitMQ	Redis (Streams / PubSub)
消息传输模式	Pull（消费者主动）	Push（默认Broker主动）/ Pull	Push（Pub/Sub）；Pull（Streams）
消息持久化	默认强持久化	可配置持久化	Streams 持久化，Pub/Sub 无
消息确认机制	手动提交 offset	Producer Confirm + Consumer Ack	Streams XACK，Pub/Sub 无
顺序保证	分区内严格有序	队列内有序	Streams 有序，Pub/Sub 无
重试与死信	自定义重试逻辑，依赖消费位移	DLX 支持死信和延迟	Streams 有 PEL 支持重试

二、核心特性对比

特性	Kafka	RabbitMQ	Redis (Pub/Sub / Streams)
核心定位	分布式流处理平台	通用消息代理 (Enterprise Messaging Broker)	内存数据结构存储 (含消息功能)
协议	自定义二进制协议	AMQP 0.9.1 / STOMP / MQTT 等	自定义协议 (RESP)
数据模型	持久化日志 (Topic/Partition)	队列 (Exchange/Queue/Binding)	Pub/Sub: Channel; Streams: 持久化日志
消息路由	基于分区键 (Producer指定)	灵活 (Direct, Topic, Fanout, Headers)	Pub/Sub: 广播到所有订阅者； Streams: 消费组
消息保证	At-Least-Once (可配置Exactly-Once)	At-Least-Once, Exactly-Once (需事务)	Pub/Sub: At-Most-Once; Streams: At-Least-Once
持久化	强持久化 (磁盘顺序写)	可选 (Exchange/Queue/Message均需配置)	Pub/Sub: 不持久化； Streams: 可持久化 (AOF/RDB)
高可用(HA)	分区副本 + ISR + Controller	镜像队列 (Mirrored Queues) / 仲裁队列	主从复制 + 哨兵 / 集群分片
吞吐量	极高 (百万级/秒)	高 (万~十万级/秒)	Pub/Sub: 极高 (内存)； Streams: 高
延迟	毫秒~秒级 (批处理影响)	微秒~毫秒级	极低 (微秒级，内存操作)
消费者模型	Pull (消费组，分区独占/共享)	Push / Pull (单条确认)	Pub/Sub: Push (广播)； Streams: Pull (消费组)
顺序保证	分区内严格有序	队列内有序	Pub/Sub: 无序； Streams: 按Entry ID有序
管理监控	丰富 (Kafka Manager, JMX等)	优秀 (Web UI, HTTP API)	基础 (CLI, 有限Dashboard)

特性详解

Kafka：高吞吐、持久化、流式处理
- 分区与副本： 主题(Topic)被分为多个分区(Partition)，分布在Broker上。每个分区可配置多个副本(Replica)，领导者(Leader)处理读写，追随者(Follower)同步数据。
- ISR (In-Sync Replicas)： 核心高可用机制。只有与Leader保持同步的副本才在ISR列表中。生产者可配置acks=all确保消息被所有ISR副本持久化后才确认，极大降低丢失风险。
- Controller Broker： 集群中一个特殊Broker，负责管理分区状态、副本选举（从ISR中选新Leader）和元数据。
- Pull模型与消费组： 消费者主动拉取(Pull)消息。消费组(Consumer Group)实现并行消费和负载均衡，一个分区同一时间只能被组内一个消费者消费。
- 持久化： 消息直接持久化到磁盘（顺序I/O），即使TB级数据也能保持高性能。提供长时间存储能力。
RabbitMQ：灵活路由、可靠交付、企业级集成
- AMQP模型： 核心是Exchange(交换机) -> Binding(绑定规则) -> Queue(队列)模型。生产者发到Exchange，Exchange根据类型(Direct, Topic, Fanout, Headers)和Routing Key将消息路由到绑定的Queue，消费者从Queue消费。
- 消息确认(Ack)：
  - 生产者确认(Publisher Confirm)： 异步回调(ConfirmCallback)，告知消息是否成功到达Exchange。ReturnCallback处理无法路由到任何Queue的消息(需设置mandatory=true)。
  - 消费者确认(Consumer Ack)： autoAck=false开启手动确认。消费者处理成功后需显式发送Basic.Ack。失败可发送Basic.Nack/Reject并选择是否重入队列(requeue)。
- 持久化： 需显式配置才能保证服务重启不丢失。三者缺一不可：交换机(durable=true)、队列(durable=true)、消息(deliveryMode=2 / PERSISTENT)。性能开销需权衡。
- 高可用： 传统方案是镜像队列(Mirrored Queues)，Master故障后Slave提升。现代方案推荐仲裁队列(Quorum Queues)，基于Raft协议，提供更强的一致性和容错性。
- 死信队列(DLX)： 通过设置队列参数(x-dead-letter-exchange)，将无法处理（被拒绝、TTL过期、队列满）的消息路由到指定的死信交换机，便于后续处理或分析。
- 延迟队列： 原生不支持。常用方案：TTL+死信队列（消息过期后进入死信队列视为延迟）或官方rabbitmq_delayed_message_exchange插件。
Redis：轻量快速、多功能、内存优先
- Pub/Sub： 经典发布订阅模式。发布者发送消息到频道(Channel)，所有订阅该频道的消费者立即收到（广播）。关键局限：消息不持久化。 离线消费者丢失消息。无消费者时消息直接丢弃。
- Streams (5.0+)： 为消息队列设计的数据结构，弥补Pub/Sub不足。类似Kafka的日志结构。
  - 消息以Entry形式追加，有唯一递增ID。
  - 支持消费组(Consumer Group)：组内消费者竞争消费消息，实现负载均衡。支持消息确认(XACK)和待处理列表(PEL)，提供At-Least-Once语义。
  - 持久化： 依赖Redis自身RDB/AOF持久化策略，可将消息保存到磁盘。
- List： 使用LPUSH/BRPOP等命令实现简单队列。需应用层处理可靠性（如确认、重试、持久化）。
- 高可用： 通过主从复制(Replication)、哨兵(Sentinel - 自动故障转移)或集群(Cluster - 分片+主从)实现，主要解决Redis服务本身的高可用，消息队列的可靠性受限于所选模式(Pub/Sub弱，Streams较强)。

三、性能与应用场景对比

维度	Kafka	RabbitMQ	Redis
吞吐量	⭐⭐⭐⭐⭐ (海量数据，批处理优化)	⭐⭐⭐⭐ (中高，可靠传输牺牲部分吞吐)	⭐⭐⭐⭐⭐ (Pub/Sub) ⭐⭐⭐⭐ (Streams) (内存操作)
延迟	⭐⭐ (受批处理、持久化影响)	⭐⭐⭐⭐ (较低，尤其内存队列)	⭐⭐⭐⭐⭐ (微秒级，极致实时)
可靠性	⭐⭐⭐⭐ (高持久化，强副本)	⭐⭐⭐⭐⭐ (灵活配置，端到端确认机制)	⭐ (Pub/Sub) ⭐⭐⭐ (Streams) (依赖配置)
顺序性	⭐⭐⭐⭐⭐ (分区内严格保证)	⭐⭐⭐⭐ (队列内保证)	⭐ (Pub/Sub) ⭐⭐⭐⭐ (Streams)
路由灵活性	⭐⭐ (基于Key哈希分区)	⭐⭐⭐⭐⭐ (多种Exchange类型，极灵活)	⭐⭐ (Pub/Sub: 频道; Streams: 简单)
功能广度	⭐⭐⭐⭐ (核心MQ + 流处理连接器)	⭐⭐⭐⭐⭐ (丰富协议、插件、管理功能)	⭐⭐⭐⭐ (MQ是子集，核心是缓存/DB)

典型应用场景

Kafka：大数据管道与流式处理
- 日志收集与聚合： 统一收集分散的系统、应用日志，供ELK、Spark/Flink分析。
- 实时流处理： 作为Flink、Spark Streaming、Kafka Streams的源和汇，处理点击流、监控指标、实时风控。
- 事件溯源(Event Sourcing)： 存储不可变事件序列，构建应用状态。
- 高吞吐消息总线： 微服务间海量数据传输 (如用户活动跟踪、运营指标上报)。
- Commit Log： 分布式系统（如数据库）的内部数据复制基础。
RabbitMQ：业务集成与可靠任务分发
- 后台任务异步化： 将耗时操作（邮件发送、文件处理、支付回调）放入队列，后台Worker处理，提升用户响应速度。
- 微服务间解耦通信： 服务A通过Exchange将消息路由到特定Queue，服务B消费，无需知道彼此地址。
- 复杂路由需求： 需要根据消息属性动态路由到不同下游服务的场景（如订单类型不同走不同流程）。
- 保证消息必达： 对金融交易、订单状态变更等要求极高可靠性的业务，利用其持久化、确认、死信机制。
- 企业应用集成(EAI)： 连接遗留系统与现代应用，支持多协议。
Redis：实时通知与轻量任务
- 实时广播通知： 聊天室、在线游戏状态更新、实时仪表盘数据推送（利用Pub/Sub低延迟）。
- 轻量级任务队列： 短时、高吞吐、允许少量丢失的任务（如缓存失效广播、实时计数更新）。可用List或Streams实现。
- Streams实现简单可靠队列： 需要比Pub/Sub更可靠、支持消费组和回溯的场景，但数据量和持久化要求低于Kafka/RabbitMQ。
- 双功能需求： 系统同时需要高速缓存和简单消息队列功能时，减少技术栈复杂度。

四、选型决策关键点（含典型应用场景）

数据量与吞吐需求：

需要处理百万级/秒以上的超高吞吐？→ Kafka是首选。
处理万~十万级/秒，且更关注延迟和灵活性？→ RabbitMQ 是均衡选择。
处理极高瞬时吞吐（如广播通知）或数据量很小的任务？→ Redis (Pub/Sub/List) 非常高效。

需求类型	建议选型	典型场景
需要处理百万级/秒以上的超高吞吐？	✅ Kafka	▶ 日志采集系统（如 Filebeat + Kafka + ELK） ▶ 电商大促期间的订单事件流（下单、支付、库存） ▶ 实时监控/埋点/链路追踪数据流
处理万~十万级/秒，且更关注延迟和灵活性？	✅ RabbitMQ	▶ 微服务间异步通信（订单 → 库存 → 发货） ▶ 交易系统中处理状态变更（风控、计费） ▶ 任务调度系统
处理极高瞬时吞吐或数据量小的任务？	✅ Redis (Pub/Sub 或 List)	▶ 实时在线聊天室消息 ▶ 推送系统：秒杀抢购成功/失败广播通知 ▶ 简单异步任务队列（邮件通知、验证码发送）

消息可靠性与持久化：

绝对不能丢失消息，需要严格端到端确认？→ RabbitMQ (Publisher Confirm + Consumer Ack + 持久化) 或 Kafka (acks=all + ISR) 是最佳选择。
允许少量丢失或消息重要性不高？→ Redis Pub/Sub 或简单List可用。
需要中等可靠性、持久化且利用Redis生态？→ Redis Streams 是折中方案。

可靠性需求	建议选型	典型场景
绝对不能丢失消息（端到端交付保证）	✅ RabbitMQ 或 Kafka	▶ 金融交易数据（支付完成、退款、账单） ▶ 订单创建与库存扣减必须一致 ▶ 实时数据管道，数据落地分析系统
允许少量丢失或消息重要性不高	✅ Redis Pub/Sub 或 List	▶ 即时通知（比如“有人点赞了你”） ▶ 非关键性日志上传 ▶ 用户行为追踪（浏览、点击）
中等可靠性，结合 Redis 生态使用	✅ Redis Streams	▶ IoT 设备上传数据（温度、电压等） ▶ 实时看板更新（股票行情、工厂监控） ▶ 内部系统日志/报警收集

消息延迟要求：

微秒级延迟是关键？→ Redis (内存操作) 无出其右。
毫秒级可接受？→ RabbitMQ 通常表现优异。
秒级甚至更高延迟可容忍（批处理、流计算场景）？→ Kafka 可以胜任且保证高吞吐。

延迟要求	建议选型	典型场景
微秒级延迟是关键？	✅ Redis（内存操作）	▶ 高速传感器数据实时反馈 ▶ 用户点击后立即触发 UI 响应（Websocket推送） ▶ 高频交易下的风控响应
毫秒级可接受？	✅ RabbitMQ	▶ 积分到账、优惠券发放等业务异步处理 ▶ 业务事件触发通知/更新状态 ▶ 定时任务（延迟消费）调度
秒级延迟可接受？	✅ Kafka	▶ 实时流计算（如行为数据流进 Kafka 后由 Flink 处理） ▶ 用户画像/数据分析汇总 ▶ 跨地域日志收集 & 聚合分析

消息路由复杂度：

需要基于多种规则（Header、Topic模式匹配、广播）灵活路由消息？→ RabbitMQ 的Exchange模型提供了最强大的路由能力。
路由规则简单（基于Key哈希分区或固定频道）？→ Kafka / Redis 可以满足。

路由复杂性	建议选型	典型场景
需要基于复杂规则灵活路由（Header、Topic等）	✅ RabbitMQ	▶ 多租户系统中根据用户ID路由消息 ▶ 不同业务模块按关键字、Tag接收不同消息 ▶ 广播/定向混合消息投递
路由规则简单（分区/频道）	✅ Kafka 或 Redis	▶ Kafka：按用户ID分区，确保消息有序 ▶ Redis：按频道推送，例如`news.sports`, `news.finance` ▶ 一对一推送或简单组播

生态系统与功能集成：

需要与流处理框架（Flink, Spark）深度集成，构建实时数据管道？→ Kafka 是事实标准。
需要支持多种协议（AMQP, MQTT, STOMP）或丰富的管理插件？→ RabbitMQ 生态成熟。
系统已重度依赖Redis作缓存/数据库，且消息需求简单？→ Redis (Streams/Pub/Sub) 可减少运维成本。

集成需求	建议选型	典型场景
需要与流处理系统无缝集成	✅ Kafka	▶ Kafka + Flink/Spark 构建实时推荐/监控系统 ▶ 数据湖管道：Kafka → HDFS/S3 → 数据仓库 ▶ 实时 ETL 系统
需要多协议兼容、企业级中间件特性	✅ RabbitMQ	▶ 同时支持 WebSocket/MQTT/STOMP 接入 ▶ 企业系统整合（ERP/CRM 连接中台） ▶ 审计、安全审查需求
已在用 Redis，消息需求不复杂	✅ Redis	▶ 系统之间轻量通知/任务派发 ▶ Redis 作为缓存 + 消息队列统一平台 ▶ 边缘设备上使用 Redis 模拟队列（性能优先）

运维复杂度与资源：

Kafka集群管理相对复杂（涉及ZooKeeper/KRaft、分区、副本、ISR调优）。
RabbitMQ配置相对直观，Web UI友好。
Redis部署最简单（单机/主从），但构建高可靠、大容量的Redis Cluster或Sentinel集群也需要经验。内存成本是主要考量。

运维情况	建议说明
Kafka：复杂度高	▶ 需要掌握分区、副本、副本选举、磁盘优化等 ▶ ZooKeeper（或KRaft）运维不可忽视 ▶ 适合有专业运维或平台团队
RabbitMQ：中等复杂	▶ 易于部署，Web UI 管理直观 ▶ 插件体系丰富（延迟交换机、管理 API） ▶ 易集成进中小型系统
Redis：最简单但资源敏感	▶ 单节点即可部署，适合嵌入式/轻量服务 ▶ 但 Redis 是内存数据库，消息堆积会导致 OOM ▶ 构建高可用 Redis Streams 也需监控复制/哨兵状态

五、使用与最佳实践概览

Kafka：
- 部署： 分布式集群（Broker + ZooKeeper 或 KRaft模式）。规划好Topic、分区数（影响并行度）、副本因子（影响容灾）和日志保留策略。
- 生产者： 根据需求配置acks (0, 1, all), compression.type, batch.size, linger.ms 以平衡吞吐、延迟和可靠性。
- 消费者： 使用消费组管理Offset。理解auto.offset.reset策略。处理Rebalance。根据分区数设置合理消费者数量。
- 监控： 密切监控Broker状态、ISR大小、分区Leader均衡、Lag(消费延迟)。
RabbitMQ：
- 部署： 单节点或集群（传统镜像队列 / 推荐仲裁队列）。合理设置资源限制(内存、磁盘)。
- 建模： 清晰定义Exchanges, Queues, Bindings。选择正确的Exchange类型和Routing Key策略。
- 可靠性： 务必启用并正确处理Publisher Confirms/Returns。消费者使用手动确认(autoAck=false)并在业务成功后Ack。强烈建议对关键Exchange、Queue和Message设置持久化。
- 资源管理： 设置队列长度限制(x-max-length)或TTL(x-message-ttl)防止堆积。利用死信队列处理异常消息。
- 监控： 利用Web UI或API监控Connection、Channel、Queue深度、Unacked消息、消息速率。
Redis：
- 模式选择：
  - 实时广播/允许丢失： 用PUBLISH/SUBSCRIBE。
  - 轻量队列/简单可靠： 用LPUSH/BRPOP (List) 或 XADD/XREADGROUP (Streams + Consumer Group)。
- 可靠性(Streams)： 配置Redis持久化(AOF with fsync everysec是较好平衡点)。消费者使用XACK确认消息。处理Pending Entries List(PEL)中的未确认消息。
- 内存管理： Streams会增长。使用XTRIM或设置MAXLEN限制Stream长度防止OOM。监控内存使用是关键。
- 高可用： 生产环境务必使用Redis Sentinel或Redis Cluster部署。