ElasticSearch:不停机更新索引类型(未验证)

文章目录

      • **一、前期准备**
        • **1. 集群健康检查**
        • **2. 备份数据**
        • **3. 监控系统准备**
      • **二、创建新索引并配置**
        • **1. 设计新索引映射**
        • **2. 创建读写别名**
      • **三、全量数据迁移**
        • **1. 执行初始 Reindex**
        • **2. 监控 Reindex 进度**
      • **四、增量数据同步**
        • **1. 方案选择**
      • **五、双写切换**
        • **1. 修改应用代码实现双写**
        • **2. 验证双写一致性**
      • **六、流量切换**
        • **1. 只读流量切换**
        • **2. 验证查询结果一致性**
        • **3. 写入流量切换**
      • **七、收尾工作**
        • **1. 恢复新索引配置**
        • **2. 验证性能和稳定性**
        • **3. 删除旧索引(可选)**
      • **八、回滚策略**
      • **九、优化建议**
      • **十、风险控制**

一、前期准备

1. 集群健康检查
GET /_cluster/health

确保:

  • statusgreen
  • number_of_nodes 符合预期
  • unassigned_shards 为 0
2. 备份数据
# 注册快照仓库
PUT /_snapshot/my_backup
{"type": "fs","settings": {"location": "/path/to/snapshots"}
}# 创建全量快照
PUT /_snapshot/my_backup/snapshot_1?wait_for_completion=true
3. 监控系统准备
  • 开启 ES 性能监控(如使用 Elastic APM、Prometheus + Grafana)
  • 设置关键指标告警(如集群负载、JVM 内存、磁盘使用率)

二、创建新索引并配置

1. 设计新索引映射
PUT /new_products
{"settings": {"index.number_of_shards": 5,  // 与旧索引保持一致"index.number_of_replicas": 1,"index.refresh_interval": "30s",  // 临时调大,提升写入性能"index.translog.durability": "async",  // 临时使用异步持久化"index.translog.sync_interval": "30s"},"mappings": {"properties": {"id": {"type": "keyword"},"name": {"type": "text"},"price": {"type": "double"},  // 假设原字段为 integer"create_time": {"type": "date", "format": "yyyy-MM-dd HH:mm:ss||epoch_millis"},"tags": {"type": "keyword"}}}
}
2. 创建读写别名
POST /_aliases
{"actions": [{ "add": { "alias": "products_read", "index": "old_products" } },{ "add": { "alias": "products_write", "index": "old_products" } }]
}

三、全量数据迁移

1. 执行初始 Reindex
POST /_reindex?wait_for_completion=false
{"source": {"index": "old_products","size": 5000,  // 每次查询 5000 条"sort": ["_doc"]  // 按文档顺序处理,避免遗漏},"dest": {"index": "new_products","op_type": "create"},"script": {"source": """// 类型转换逻辑if (ctx._source.containsKey("price")) {ctx._source.price = Double.parseDouble(ctx._source.price.toString());}// 日期格式转换if (ctx._source.containsKey("create_time")) {try {ctx._source.create_time = new Date(ctx._source.create_time).getTime();} catch (Exception e) {// 处理异常日期格式ctx._source.create_time = System.currentTimeMillis();}}"""}
}
2. 监控 Reindex 进度
GET /_tasks?detailed=true&actions=*reindex

四、增量数据同步

1. 方案选择
  • 方案 A:基于时间戳的定时同步(适合有 update_time 字段的场景)
POST /_reindex?wait_for_completion=false
{"source": {"index": "old_products","query": {"range": {"update_time": {"gte": "{{last_sync_time}}",  // 上次同步时间"lt": "now"}}}},"dest": {"index": "new_products"}
}
  • 方案 B:基于 Canal 的 binlog 订阅(适合 ES 作为 MySQL 从库的场景)
# 部署 Canal 客户端
canal.deployer-1.1.5/bin/startup.sh# 配置 canal.instance.filter.regex=.*\\..* 监听全量变更

五、双写切换

1. 修改应用代码实现双写

在应用层同时写入新旧索引:

// 伪代码示例
public void indexProduct(Product product) {// 写入旧索引esClient.index("products_write", product);// 写入新索引(带类型转换)Product newProduct = convertProduct(product);esClient.index("new_products", newProduct);
}
2. 验证双写一致性
// 对比同一文档在新旧索引中的差异
GET old_products/_doc/1
GET new_products/_doc/1

六、流量切换

1. 只读流量切换
POST /_aliases
{"actions": [{ "remove": { "alias": "products_read", "index": "old_products" } },{ "add": { "alias": "products_read", "index": "new_products" } }]
}
2. 验证查询结果一致性
// 对比相同查询在新旧索引中的结果
GET products_read/_search?q=name:iphone
GET old_products/_search?q=name:iphone
3. 写入流量切换
POST /_aliases
{"actions": [{ "remove": { "alias": "products_write", "index": "old_products" } },{ "add": { "alias": "products_write", "index": "new_products" } }]
}

七、收尾工作

1. 恢复新索引配置
PUT /new_products/_settings
{"index.refresh_interval": "1s","index.translog.durability": "request","index.translog.sync_interval": "5s"
}
2. 验证性能和稳定性
  • 监控集群负载
  • 验证业务查询性能
  • 验证写入吞吐量
3. 删除旧索引(可选)
DELETE /old_products

八、回滚策略

若出现问题,可快速回滚:

POST /_aliases
{"actions": [{ "remove": { "alias": "products_read", "index": "new_products" } },{ "add": { "alias": "products_read", "index": "old_products" } },{ "remove": { "alias": "products_write", "index": "new_products" } },{ "add": { "alias": "products_write", "index": "old_products" } }]
}

九、优化建议

  1. 分批次迁移:对百万级数据,按时间或 ID 范围分批 Reindex,避免单次任务过大
  2. 限流控制
POST /_reindex?wait_for_completion=false
{"source": { "index": "old_products" },"dest": { "index": "new_products" },"requests_per_second": 100  // 每秒处理 100 个请求
}
  1. 临时扩容:迁移期间增加专用协调节点,减轻数据节点压力
  2. 预热缓存:迁移后对热点数据执行预热查询
  3. 自动化脚本:使用 Python 脚本编排整个流程:
import requests
import timedef reindex_with_progress():# 启动 reindexresponse = requests.post("http://localhost:9200/_reindex?wait_for_completion=false",json={"source": {"index": "old_products"},"dest": {"index": "new_products"}})task_id = response.json()["task"]# 监控进度while True:status = requests.get(f"http://localhost:9200/_tasks/{task_id}").json()completed = status["task"]["status"]["completed"]total = status["task"]["status"]["total"]print(f"进度: {completed}/{total} ({completed/total*100:.2f}%)")if status["completed"]:breaktime.sleep(5)reindex_with_progress()

十、风险控制

  1. 灰度发布:先迁移部分数据进行验证
  2. 熔断机制:设置错误率阈值,超过则自动停止迁移
  3. 预留资源:确保集群有 30% 以上的空闲资源
  4. 夜间执行:选择业务低峰期执行核心操作

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/915499.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/915499.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python学智能算法(二十七)|SVM-拉格朗日函数求解上

【1】引言 前序学习进程中,我们已经掌握了支持向量机算法中,为寻找最佳分割超平面,如何用向量表达超平面方程,如何为超平面方程建立拉格朗日函数。 本篇文章的学习目标是:求解SVM拉格朗日函数。 【2】求解方法 【2.…

mac安装node的步骤

适用于macOS 10.15及以上版本。 前提条件 macOS版本:确保系统为macOS 10.15(Catalina)或更高版本。可在“苹果菜单 > 关于本机”查看。管理员权限:部分安装可能需要管理员权限。网络连接:需要联网下载安装包或工具…

【LeetCode数据结构】栈的应用——有效的括号问题详解

🔥个人主页:艾莉丝努力练剑 ❄专栏传送门:《C语言》、《数据结构与算法》、C语言刷题12天IO强训、LeetCode代码强化刷题 🍉学习方向:C/C方向 ⭐️人生格言:为天地立心,为生民立命,为…

多尺度卷积模型:Inception块

在GoogLeNet中,基本的卷积块被称为Inception块(Inception block)。 使用窗口大小为11,33,551\times1,3\times3,5\times511,33,55的卷积层,从不同空间大小中提…

Android 默认图库播放视频没有自动循环功能,如何添加

Android 默认图库播放视频没有自动循环功能, 如何添加 按如下方式添加 开发云 - 一站式云服务平台 .../apps/Gallery2/res/values-zh-rCN/strings.xml | 3 ++ packages/apps/Gallery2/res/values/strings.xml | 3 ++ .../com/android/gallery3d/app/MovieActivity…

7月21日总结

命令执行 RCE RCE(remote code execute):远程命令执行或者代码执行,我们平时说的rce,比如thinkPHP的 rce漏洞,即算代码注入漏洞,也算rce漏洞,因为渗透的最终情况可以实现执行命令或…

Linux——自制shell命令行解释器

文章目录1.打印命令提示符2.获取用户输入指令3.重定向分析4.命令行参数表,环境变量表,初始化5.命令解析6.命令执行6.1.创建子进程6.2 处理内建命令6.3 文件重定向7.源码前言 在实现shell的时候我们先创建自己myshell目录,在目录中创建myshell.cc文件,因…

Boost库智能指针boost::shared_ptr详解和常用场景使用错误示例以及解决方法

1、Boost智能指针 —— boost::shared_ptr 详解一、什么是 boost::shared_ptr boost::shared_ptr 是 Boost 库中实现的一个智能指针模板类,用于管理动态分配的对象生命周期,采用引用计数机制。多个 shared_ptr 实例可以共享同一个对象的所有权&#xff0…

科学分析指南,如何快速找到并清理磁盘的无用文件

随着时间的推移,系统中会积累大量的临时文件、缓存文件、不再需要的安装包或其他大型文件。磁盘清理可以删除这些不必要的文件,从而释放宝贵的磁盘空间。它无需安装,插上 U 盘就能直接使用。只需勾选需要扫描的磁盘,点击“开始分析…

Laravel 系统版本查看及artisan管理员密码找回方法针对各个版本通用方法及原理-优雅草卓伊凡

Laravel 系统版本查看及artisan管理员密码找回方法针对各个版本通用方法及原理-优雅草卓伊凡一、查看 Laravel 版本的方法优雅草蜻蜓T会议系统专业版 最近又有客户要了,但是发现 密码不对 管理员账户密码不对,卓伊凡必须处理下,这里顺便讲解密…

针对大规模语言模型的上下文工程技术调研与总结(翻译并摘要)

针对大规模语言模型的上下文工程技术调研与总结声明摘要部分翻译介绍部分翻译相关工作部分翻译并摘要为什么使用上下文工程(翻译并摘要)基础组件(翻译并摘要)RAG(翻译并摘要简单介绍一下个人认为比较好的技术&#xff…

QT配置Quazip外部库

1.下载QuaZip源码网址:https://sourceforge.net/projects/quazip/  注:下载->解压->打开.pro文件2.编译QuaZip源码2.1配置zlib注:QuaZip需zlib的支持,我们需要引用zlib找到本地安装Qt目录下zlib目录:注&#x…

从C++开始的编程生活(4)——类的定义、访问限定符、类域、类的实例化和this指针

前言 本系列文章承接C语言的学习,需要有C语言的基础才能学会哦~ 第3篇主要讲的是有关于C的类的定义、访问限定符、类域、类的实例化和this指针。 C才起步,都很简单呢! 目录 前言 类 基本语法 访问限定符 基本语法 类域 类的实例化 内…

AD域控制器虚拟化的安全加固最佳实践

以下是AD域控制器虚拟化安全加固的7项核心实践,结合最新Windows Server 2022特性与虚拟化环境需求:基础架构强化‌ 采用静态IP分配并确保所有域控节点DNS指向主DC(如192.168.1.10)‌ 虚拟机模板需预配置林/域功能级别为Windows Se…

java解析nc气象数据

1.1pom.xml<dependency><groupId>edu.ucar</groupId><artifactId>netcdfAll</artifactId><version>5.4.1</version></dependency>1.2 netcdf使用/** param type 0 ,1, 2 wind 1 or 2 其他 0 .* return Map* */public Map i…

STC8H8K64U SKDIP28芯片频率占空比PWM波形

/****PWM输出任意周期占空比波形*******/ #include "STC8H.h" // #include "intrins.h" // #define uchar unsigned char // #define uint unsig…

【RK3576】【Android14】USB开发调试

获取更多相关的【RK3576】【Android14】驱动开发&#xff0c;可收藏系列博文&#xff0c;持续更新中&#xff1a; 【RK3576】Android 14 驱动开发实战指南 硬件接口 RK3576支持两个USB3.0控制器 驱动开发 dts配置 在“Android14/kernel-6.1/arch/arm64/boot/dts/rockchip/rk…

20. TaskExecutor与ResourceManager心跳

20. TaskExecutor与ResourceManager心跳 现在&#xff0c;需要回过头看 ResourceManager是如何产生心跳管理服务的。cluster.initializeServices 方法的 heartbeatServices createHeartbeatServices(configuration);产生一个 HeartbeatServicesImpljobmanager的 resourceManag…

OS19.【Linux】进程状态(上)

目录 1.情景引入 2.操作系统学科对进程状态的分类 运行状态 基于时间片的轮转调度算法 阻塞状态 等待IO设备的例子 等待其他进程中需要获取的数据 进程唤醒 挂起状态(全称为阻塞挂起状态) 简单谈谈虚拟内存管理 就绪状态 笔面试题 3.Linux对进程状态的分类 R和S状…

如何优雅地修改项目的 Android 版本(API 级别)

引言 在 Android 开发的日常迭代中&#xff0c;我们经常需要升级或降级项目的 minSdkVersion、targetSdkVersion 与 compileSdkVersion。升级可以解锁新特性和性能优化&#xff1b;降级则可能为了兼容旧机型或快速验证问题。本文将手把手演示在 Android Studio 里修改 Android …