📦 1、简述
Kafka 以其高吞吐、可扩展和高可靠性著称,其强大性能的背后核心在于其高效的存储设计。Kafka 不是传统意义上的队列,而是一个分布式日志系统,其存储模块是核心组成部分。
本文将深入剖析 Kafka 的存储接口实现机制,并结合 Java 示例进行模拟验证。
🧱 2、存储架构概览
Kafka 存储机制主要体现在以下几个关键组件中:
组件 | 描述 |
---|---|
Topic | 逻辑概念,表示一类消息流 |
Partition | Topic 下的子单元,每个分区对应一个物理日志文件 |
Segment | 分区下的物理日志文件,按时间或大小滚动生成 |
Log Index | 用于加快在 Segment 中查找消息位置 |
Log Cleaner | 针对 |