面试官:详细说说Kafka rebalance 的策略以及具体过程

hello啊,各位观众姥爷们!!!本baby今天又来报道了!哈哈哈哈哈嗝🐶

程序员各种工具大全

Kafka 的 Rebalance(再平衡) 是消费者组(Consumer Group)在消费者数量变化或分区分配异常时,重新分配分区(Partition)给消费者的过程。


一、触发 Rebalance 的条件

  1. 消费者加入或离开组(如启动、崩溃、主动退出)
  2. 订阅的 Topic 分区数变化(如管理员增加分区)
  3. 消费者会话超时session.timeout.ms,默认45秒)
  4. 心跳超时heartbeat.interval.ms,默认3秒)
  5. 消费处理超时max.poll.interval.ms,默认5分钟)

二、Rebalance 策略(Partition Assignor)

Kafka 提供三种分区分配策略,通过 partition.assignment.strategy 配置:

1. Range(范围分配,默认)
  • 规则:按 Topic 的字典序排序分区,均匀划分范围给消费者。
  • 示例
    • TopicA 有3分区(P0,P1,P2),TopicB 有2分区(P0,P1),2个消费者(C1,C2)
    • 分配结果:
      C1: TopicA-P0, TopicA-P1, TopicB-P0  
      C2: TopicA-P2, TopicB-P1
      
  • 问题:可能导致分区分配不均(如 Topic 数量多时)。
2. RoundRobin(轮询分配)
  • 规则:将所有 Topic 的分区按哈希排序后轮询分配。
  • 示例
    • 同上例,分配结果:
      C1: TopicA-P0, TopicB-P0  
      C2: TopicA-P1, TopicB-P1  
      C1: TopicA-P2 (额外分配)
      
  • 优势:分配更均匀,适合消费者处理能力相近的场景。
3. Sticky(粘性分配)
  • 规则:尽量保留原有分配,仅调整变化的部分。
  • 优势:减少分区迁移开销(避免重复加载本地缓存)。
  • 适用场景:消费者频繁变动的组(如容器化环境)。

三、Rebalance 详细流程

1. 消费者发起 JoinGroup 请求
ConsumerCoordinatorJoinGroup Request返回组当前状态(无Leader则选举)ConsumerCoordinator
2. 选举消费者组 Leader
  • 规则:第一个成功加入组的消费者成为 Leader。
  • Leader 职责:执行实际的分区分配计算。
3. 同步组信息(SyncGroup)
Leader ConsumerCoordinatorAll ConsumersSyncGroup Request(携带分配方案)SyncGroup Response(分配结果)Leader ConsumerCoordinatorAll Consumers
4. 分区分配生效
  • 消费者收到新分配的分区列表,开始消费。

四、Rebalance 的问题与优化

1. 常见问题
  • 频繁 Rebalance
    • 原因:心跳超时或 max.poll.interval.ms 设置过小。
    • 现象:消费者被误判为离线。
  • 数据重复/丢失
    • Rebalance 期间偏移量提交失败,导致重复消费或跳过消息。
2. 生产环境优化
  • 参数调优
    # 适当增大超时时间
    session.timeout.ms=10000
    heartbeat.interval.ms=3000
    max.poll.interval.ms=300000
    
  • 避免长时间处理
    • 优化 poll() 后的处理逻辑,确保在 max.poll.interval.ms 内完成。
  • 静态成员(Static Membership)
    • 为消费者分配固定 group.instance.id,短暂离线时保留分区分配。
    group.instance.id=consumer-1
    

五、完整 Rebalance 过程示例

  1. 初始状态

    • 消费者组:C1(Leader)、C2
    • 分区分配:
      C1: P0, P1  
      C2: P2, P3
      
  2. C3 加入组

    • 触发 Rebalance,C1 计算新分配:
      C1: P0  
      C2: P1  
      C3: P2, P3
      
    • Coordinator 同步新方案给所有消费者。
  3. C2 崩溃

    • 会话超时后触发 Rebalance,C1 重新分配:
      C1: P0, P1  
      C3: P2, P3
      

监控与调试

1. 关键指标
# 查看消费者组状态
kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group my-group# 监控Rebalance次数
kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --group my-group
2. 日志分析
# Broker日志(Coordinator)
[GroupCoordinator] Preparing to rebalance group my-group with old generation 1
[GroupCoordinator] Stabilized group my-group generation 2

程序员各种工具大全

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:
http://www.pswp.cn/web/90927.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/90927.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++入门自学Day2-- c++类与对象(初识)

一、面向对象和面向过程1、什么是面向过程(Process-Oriented Programming, POP)📌 定义面向过程强调的是 过程(过程函数),即:按照步骤(流程)组织代码。程序结构 数据结构…

DAO组织智能合约开发:从理论到实践

目录 DAO组织智能合约开发:从理论到实践 1. DAO概述:去中心化自治组织 2. DAO核心组件设计 2.1 架构设计 2.2 关键智能合约 3. 治理代币实现 3.1 ERC20扩展合约 4. 提案管理系统实现 4.1 提案状态机 4.2 提案合约实现 5. DAO核心合约实现 5.1 DAO合约架构 5.2 提案类型扩展 6…

Ubuntu系统完整配置教程

Ubuntu系统完整配置教程 目录 配置镜像源安装网络服务虚拟机中安装CUDAPython开发环境配置Java开发环境配置 1. 配置镜像源 1.1 备份原始源文件 sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup1.2 编辑源文件 sudo nano /etc/apt/sources.list1.3 各大镜像源…

【mysql慢查询】

mysql慢查询慢查询慢查询日志配置慢查询 慢查询是指执行时间超过指定阈值的SQL语句。在MySQL中,默认情况下执行时间超过10秒的查询会被认为是慢查询,但这个阈值可以根据需要进行调整。 慢查询日志配置 -- 查看当前慢查询配置 SHOW VARIABLES LIKE slo…

django 按照外键排序

在Django中,使用外键(ForeignKey)进行排序是一种常见的需求,特别是在处理数据库关系时,如用户和订单之间的关系(一个用户有多个订单)。下面是如何在使用Django ORM时进行基于外键的排序。 定义模…

JAVA_EIGHTEEN_特殊文件

目录 Properties属性文件 XML的作用和应用场景 日志技术 Properties属性文件 约束:只能是键值对 键不能重复 文件后缀一般是.properties结尾的 是一个Map集合(键值对集合) 核心作用:Properties是用来代表属性文件的&#…

第二十二节 MATLAB转置向量、MATLAB追加向量

MATLAB中转置操作能够将一个行向量改变成一个列向量,反之亦然。MATLAB中转置操作使用一个单引号()来表示。详细例子在MATLAB中建立一个脚本文件,输入下述代码:r [ 1 2 3 4 ]; tr r; v [1;2;3;4]; tv v; disp(tr); …

window显示驱动开发—Direct3D 11 视频设备驱动程序接口 (DDI)

这些设备驱动程序接口 (DDI) 是新的或针对Windows 8更新的:CalcPrivateCryptoSessionSizeCalcPrivateAuthenticatedChannelSizeCalcPrivateVideoDecoderOutputViewSizeCalcPrivateVideoDecoderSizeCalcPrivateVideoProcessorEnumSizeCalcPrivateVideoProcessorInput…

新手向:用AI破解数据质量难题

用AI破解数据质量难题:从零开始的完整指南数据质量的重要性及其影响数据质量是数据分析、机器学习和业务流程中不可忽视的核心问题。低质量数据会导致一系列严重后果:错误决策:基于不准确或缺失的数据可能导致管理层做出错误判断。例如&#…

用 Python 获取电脑电池电量的各种案例

更多内容请见: python3案例和总结-专栏介绍和目录 文章目录 方法一:使用 `psutil` 库(跨平台) 方法二:Windows 专用方法(使用 `win32api`) 方法三:macOS 专用方法 方法四:Linux 专用方法 方法五:跨平台统一方法 Python 程序案例:检测电池电量并在低于20%时关机 以下…

Linux->自定义shell

目录 引入: 1:shell是什么? 2:命令行提示符是什么? 3:xshell是什么? 一:命令行提示符 二: 获取用户输入 三:分割字符串 四:执行命令 五…

js中出现-8.881784197001252e-16这种(一个极其接近 0 的极小负数)的浮点数精度计数异常问题解决思路

你的代码中出现 -8.881784197001252e-16(一个极其接近 0 的极小负数)的原因是 JavaScript 浮点数精度问题。具体来说,当你反复进行 加法 和 减法 时,由于浮点数在计算机中的存储方式,可能会引入微小的误差。一、问题情…

超详细的 RustDesk 自建中继节点教程

厌倦了商业远程控制软件的会员限制和功能阉割?渴望拥有一个自由掌控、安全可靠的远程连接方案?开源软件 RustDesk 正是你需要的答案! 相信从事互联网工作的你,一定对向日葵和ToDesk等商业远程控制软件并不陌生。然而,…

Spring Boot 2整合Druid的两种方式

一、自定义整合Druid&#xff08;非Starter方式&#xff09;适用于需要完全手动控制配置的场景添加依赖&#xff08;pom.xml&#xff09;<dependency><groupId>com.alibaba</groupId><artifactId>druid</artifactId><version>1.2.8</ve…

鸿蒙Next-开发版本升级,API升级(例如API12升API16)

鸿蒙更新换代很快的&#xff0c;2025年1月&#xff0c;截至4月就有 DevEco Studio 5.0.2 Release 升级到 DevEco Studio 5.0.3 Release 升级到 DevEco Studio 5.0.4 Release&#xff0c;三次大版本更新。 作者也想在年前创建的项目中体验一下新版本的特性&#xff0c;于是查看了…

树莓派设置时区

查看当前时间 piraspberrypi-CM5:~ $ date Mon 28 Jul 09:22:38 BST 2025BST 指的是 British Summer Time&#xff0c;即英国夏令时&#xff08;UTC1&#xff09;。 所以这是英国&#xff08;伦敦等地&#xff09;在夏令时期间的本地时间&#xff0c;比标准的 UTC 时间快 1 小时…

C Primer Plus 第6版 编程练习——第13章(下)

8.编写一个程序&#xff0c;以一个字符和任意文件名作为命令行参数。如果字符后面没有参数&#xff0c;该程序读取标 淮输入;否则&#xff0c;程序依次打开每个文件并报告每个文件中该字符出现的次数。文件名和字符本身也要一同报告。程序应包含错误检查&#xff0c;以确定参数…

王树森推荐系统公开课

github&#xff1a;https://github.com/wangshusen/RecommenderSystem b站&#xff1a;推荐系统公开课——8小时完整版&#xff0c;讲解工业界真实的推荐系统_哔哩哔哩_bilibili 知乎上一个比较全面的笔记&#xff1a;https://zhuanlan.zhihu.com/p/678664853 我的笔记&…

<RT1176系列11>DMAMUX解读

1、概述DMA&#xff08;直接内存访问&#xff0c;DIrect Memory Access&#xff09;工作原理&#xff1a;DMA控制器直接在内存和外设之间传输数据&#xff0c;而不需要CPU的干预。优点&#xff1a;极大地提高了数据传输效率&#xff0c;释放CPU资源。适合大批量数据传输&#x…

【MySQL】MySQL 缓存方案

一、MySQL主从同步 1.1 主从同步是什么 MySQL 主从同步是一种数据复制机制&#xff0c;通过该机制可以实现将主数据库&#xff08;Master&#xff09;的 DDL&#xff08;数据定义语言&#xff09;和 DML&#xff08;数据操纵语言&#xff0c;如 update、insert、delete&#x…