Kafka的ISR、OSR、AR详解

Kafka中的ISR、OSR和AR是副本管理机制的核心概念,它们共同保障了Kafka的高可用性和数据一致性。下面我将详细解释这些概念及其相互关系。

1. 基本概念

1.1 AR (Assigned Replicas) - 分配副本

定义:一个分区的所有副本集合称为AR,即Kafka为主题分区分配的所有副本。

特点

  • 包含该分区的所有副本(Leader和Follower)
  • AR = ISR + OSR
  • 由Kafka控制器(Controller)负责管理分配

1.2 ISR (In-Sync Replicas) - 同步副本

定义:与Leader副本保持同步的副本集合(包括Leader自己)。

特点

  • 实时与Leader保持数据同步
  • 只有ISR中的副本才有资格被选举为Leader
  • 生产者消息需要被ISR中所有副本确认才算提交成功(取决于acks配置)

1.3 OSR (Out-of-Sync Replicas) - 非同步副本

定义:与Leader副本同步滞后过多的副本集合。

特点

  • 未能及时跟上Leader的同步进度
  • 不在ISR集合中
  • 当OSR副本重新追上Leader进度后,可以重新加入ISR

2. 工作机制详解

2.1 副本状态转换

[新副本] → [ISR] ↔ [OSR]
  • 新创建的副本初始加入ISR
  • 当副本滞后超过replica.lag.time.max.ms(默认30秒)时,从ISR移到OSR
  • 当OSR副本追上Leader进度后,重新加入ISR

2.2 同步判定标准

副本是否保持同步由以下参数控制:

  1. replica.lag.time.max.ms (默认30000ms)

    • Follower副本在此时间内未向Leader发送FETCH请求
    • 或在此时间内未追上Leader的最新offset
  2. replica.lag.max.messages (已弃用)

    • 旧版本用于判断消息滞后条数
    • 新版本已移除该配置

2.3 Leader选举

当分区Leader失效时:

  1. 只能从ISR集合中选举新Leader
  2. 如果ISR为空,根据unclean.leader.election.enable配置决定:
    • false(默认):不允许选举,分区不可用
    • true:可以从OSR中选举(可能丢失数据)

3. 配置参数

参数默认值说明
default.replication.factor1新建主题的默认副本数
min.insync.replicas1最小同步副本数(影响生产者acks=all时的可用性)
replica.lag.time.max.ms30000副本滞后时间阈值
unclean.leader.election.enablefalse是否允许从非同步副本选举Leader

4. 数据一致性保障

Kafka通过ISR机制实现不同级别的一致性:

  1. acks=0:不等待确认,可能丢失数据
  2. acks=1:仅等待Leader确认(默认)
  3. acks=all:等待ISR中所有副本确认

生产环境推荐配置:

min.insync.replicas=2
acks=all

这样即使一个副本失效,仍能保证数据安全。

5. 监控与管理

5.1 查看副本状态

使用kafka-topics命令:

bin/kafka-topics.sh --describe --bootstrap-server localhost:9092 --topic test

输出示例:

Topic: test Partition: 0 Leader: 1 Replicas: 1,2,3 Isr: 1,2
  • Replicas: AR列表(1,2,3)
  • Isr: 同步副本列表(1,2)
  • OSR = AR - ISR = 3

5.2 重要监控指标

  1. UnderReplicatedPartitions:非充分复制分区数(ISR < AR)
  2. IsrShrinksPerSec:ISR收缩次数(副本离开ISR)
  3. IsrExpandsPerSec:ISR扩展次数(副本加入ISR)

6. 生产环境建议

  1. 设置replication.factor≥3,保证高可用
  2. 设置min.insync.replicas=2,平衡可用性与一致性
  3. 监控ISR变化,异常时及时报警
  4. 避免频繁的Leader切换(配置合理的replica.lag.time.max.ms
  5. 保持unclean.leader.election.enable=false,防止数据丢失

7. 故障场景分析

场景1:Follower副本同步慢

  • 现象:某个Follower持续在OSR中
  • 可能原因:
    • 磁盘I/O瓶颈
    • 网络延迟
    • 机器负载过高
  • 解决方案:
    • 检查副本节点硬件状态
    • 优化Kafka JVM配置
    • 考虑替换问题节点

场景2:ISR频繁收缩/扩展

  • 现象:IsrShrinks/IsrExpands指标频繁变化
  • 可能原因:
    • replica.lag.time.max.ms设置过小
    • 网络不稳定
  • 解决方案:
    • 适当增大replica.lag.time.max.ms
    • 检查网络状况

通过合理配置和监控ISR机制,可以确保Kafka集群在保证数据一致性的同时,维持高可用性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/919561.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/919561.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第一阶段C#基础-13:索引器,接口,泛型

1_索引器&#xff08;1&#xff09;索引器是C#中一个强大而实用的特性&#xff0c;允许像访问数组一样访问类的成员&#xff08;2&#xff09;索引器&#xff1a;一种可以让我们使用索引来访问对象的一种方法&#xff0c;是一组get,set访问器&#xff0c;与属性类似&#xff0c…

SQL-leetcode— 2356. 每位教师所教授的科目种类的数量

2356. 每位教师所教授的科目种类的数量 表: Teacher ----------------- | Column Name | Type | ----------------- | teacher_id | int | | subject_id | int | | dept_id | int | ----------------- 在 SQL 中&#xff0c;(subject_id, dept_id) 是该表的主键。 该表…

基于单片机温控风扇设计/PWM调速风扇/智能风扇

传送门 &#x1f449;&#x1f449;&#x1f449;&#x1f449;其他作品题目速选一览表 &#x1f449;&#x1f449;&#x1f449;&#x1f449;其他作品题目功能速览 概述 该设计基于单片机实现智能温控风扇系统&#xff0c;通过温度传感器实时监测环境温度&#xff0c;…

【datawhale组队学习】RAG技术 - TASK02

教程地址&#xff1a;https://github.com/datawhalechina/all-in-rag/ 感谢datawhale的教程&#xff0c;以下笔记大部分内容来自该教程 文章目录基于LangChain框架的RAG实现初始化设置数据准备索引构建查询与检索生成集成低代码&#xff08;基于LlamaIndex&#xff09;conda ac…

Mitt 事件发射器完全指南:200字节的轻量级解决方案

简介 Mitt 是一个轻量级的事件发射器库&#xff0c;体积小巧&#xff08;约 200 字节&#xff09;&#xff0c;无依赖&#xff0c;支持 TypeScript。它提供了简单而强大的事件发布/订阅机制&#xff0c;适用于组件间通信、状态管理等场景。 特点 &#x1f680; 超轻量级&…

数据库锁与死锁-笔记

一、概述 数据库是一个共享资源,可以供给多个用户使用。运行多个用户同时使用一个数据库的数据系统统称多用户数据库系统。例如,飞机订票数据库系统。在这样的一个系统中,在同一时刻并发运行的事务数可达数百上千个。 当多个用户并发地存取数据库时就会产生多个事务同时存…

渗透艺术系列之Laravel框架(二)

任何软件&#xff0c;都会存在安全漏洞&#xff0c;我们应该将攻击成本不断提高&#xff01;​**——服务容器与中间件的攻防博弈**​本文章仅提供学习&#xff0c;切勿将其用于不法手段&#xff01;一、服务容器的"依赖注入陷阱"1.1 接口绑定的"影子服务"…

官网SSO登录系统的企业架构设计全过程

第一阶段&#xff1a;架构愿景与业务架构设计 (Architecture Vision & Business Architecture) 任何架构的起点都必须是业务目标和需求。 1.1 核心业务目标 (Business Goals) 提升用户体验&#xff1a;用户一次登录&#xff0c;即可无缝访问集团下所有子公司的官网和应用&a…

2025世界机器人大会:中国制造“人形时代”爆发

2025世界机器人博览会8月8日在北京亦庄开幕&#xff0c;主题为“让机器人更智慧&#xff0c;让具身体更智能”&#xff0c;汇聚全球200余家企业、1500余件展品&#xff0c;其中首发新品超100款&#xff0c;人形机器人整机企业参展数量创同类展会之最。 除了机器人本体外&#…

Oracle 库定期备份表结构元数据信息至目标端备份脚本

一、背景描述当前 xxx 项目 Oracle 11g RAC 库缺少 DG&#xff0c;并且日常没有备份&#xff0c;存在服务器或存储损坏&#xff0c;数据或表结构存在丢失风险&#xff0c;在和项目组同步后&#xff0c;项目组反馈可对该数据库定期备份相关结构信息&#xff0c;如存在数据丢失&a…

wps安装后win系统浏览窗口无法查看

前提需要有安装office软件&#xff0c;PDF一般默认是浏览器&#xff0c;如果设置浏览器不行&#xff0c;就安装Adobe Acrobat DC软件1、按winR键&#xff0c;输入regedit&#xff0c;进入注册表2、找到路径&#xff1a;\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Current…

Qt 中最经典、最常用的多线程通信场景

实现步骤创建工作类 (Worker)&#xff1a;在工作线程中处理数据的对象。创建线程对象 (QThread)&#xff1a;用来托管工作对象。连接信号槽&#xff1a;主线程 -> 工作线程&#xff1a;连接一个主窗口发出的信号到工作对象的槽&#xff0c;用于传递数据。工作线程 -> 主线…

【CV 目标检测】Fast RCNN模型①——与R-CNN区别

3.Fast RCNN模型 相比于R-CNN&#xff0c;Fast RCNN模型主要在以下三个方面进行了改进&#xff1a; 提高训练和预测速度 R-CNN首先从测试图中提取2000个候选区域&#xff0c;然后将这2000个候选区域分别输入到预训练好的CNN中提取特征。由于候选区域有大量的重叠&#xff0c;这…

Zookeeper学习

要精通 ZooKeeper&#xff0c;需要掌握其核心原理、数据模型、分布式协调机制、典型应用场景、运维管理与性能调优等方面的知识。以下是系统化的知识体系&#xff1a;✅ 一、ZooKeeper 基础原理ZooKeeper 是什么 分布式协调服务&#xff0c;提供一致性、高可用的元数据管理核心…

用TestComplete打造高效CI/CD测试流程

传统的UI测试往往受限于图形界面渲染&#xff0c;导致执行速度慢、资源占用高&#xff0c;难以适应持续集成/持续交付&#xff08;CI/CD&#xff09;管道的需求。自动化UI测试平台TestComplete的智能质量附加组件通过无头测试技术&#xff0c;为开发团队提供了一种更高效、更可…

C++ 浅拷贝 和深拷贝的知识点讲解

好问题 &#x1f44d;&#xff0c;这个就是理解 delete 的关键前置知识。 我从 C语言基础 出发&#xff0c;像教科书一样&#xff0c;从零讲给你听。1. 什么是“拷贝”&#xff1f; 在 C 中&#xff0c;当你有一个对象 A&#xff0c;然后写&#xff1a; Device_Info a; Device…

Arkts加载网页url的pdf发票黑屏问题

使用模拟器会闪退&#xff0c;连接真机预览正常import { HMRouter, HMRouterMgr, HMParamType, HMPageParam } from "hadss/hmrouter"; import { BaseTitle, RouterConstants } from "commonlib"; import { webview } from kit.ArkWeb; import { PDFView }…

使用 mongosh 设置 MongoDB 账号密码

可以使用 mongosh(MongoDB 6.0+ 的现代Shell)来设置账号密码。mongosh 是官方推荐的新一代MongoDB Shell工具,替代了传统的 mongo 命令。 【本人博文提到的ip均为随机生成的,不是实际的ip,仅供参考,如有雷同,纯属巧合】 使用 mongosh 设置 MongoDB 账号密码 1. 首先连…

HTML+CSS:浮动详解

在HTMLCSS布局中&#xff0c;浮动&#xff08;float&#xff09; 是一种经典的布局技术&#xff0c;用于控制元素在页面中的排列方式。它最初设计用于实现文字环绕图片的效果&#xff0c;后来被广泛用于复杂布局&#xff0c;但随着Flexbox和Grid的兴起&#xff0c;其使用场景有…

GPIO初始化及调用

下面把 HAL 库 和 标准外设库&#xff08;SPL&#xff09; 初始化 GPIO 点亮/熄灭 LED 的完整步骤、示例代码和常用 API 逐一说清楚。用例默认 PC13 接 LED&#xff08;蓝板常见&#xff1b;低电平点亮&#xff0c;高电平熄灭——若板子相反&#xff0c;只把写 1/0 对调即可&am…