【生产实践】华为存储XSG1在RHEL 7.x/8.x上的多路径配置操作手册(生产环境)

华为存储多路径

一、概述

本手册针对Red Hat Enterprise Linux 7.x/8.x系统与华为XSG1存储设备的多路径I/O(MPIO)配置,通过优化路径策略实现高可用、负载均衡及故障容错,适配华为存储硬件特性,满足生产环境需求。

二、参数解析与配置

1. 设备标识(Vendor/Product)

  • vendor "HUAWEI":指定华为为供应商,加载华为专用DSM,适配存储特性(如ALUA、路径优先级)。
  • product "XSG1":匹配XSG1系列存储LUN,批量应用配置。

2. 路径分组(path_grouping_policy)

  • multibus:将所有活动路径(如双HBA卡连接的路径)视为一组,I/O在组内均衡分配,适用于华为Active/Active模式,最大化路径利用率。

3. 优先级与路径选择

  • prio const:恒定优先级,所有路径同权(华为对称式路径设计场景)。
  • path_selector "service-time 0":按服务时间均匀负载,0表示权重相同,I/O均匀分配,避免单路径过载。

4. 故障处理

  • path_checker tur:通过TUR命令检测路径状态,快速发现链路/设备故障(如光纤断开、控制器无响应)。
  • failback immediate:主路径恢复后立即回切,确保最优性能(如华为主控制器恢复时快速切换)。
  • dev_loss_tmo 30:设备无响应30秒判定为丢失,触发故障转移,需与存储故障恢复时间匹配。
  • fast_io_fail_tmo 5:5秒内快速处理I/O失败(如路径永久故障),减少应用阻塞。
  • no_path_retry 15:无路径时重试15次后失败,避免无限等待(存储完全下线时通知应用)。

三、配置步骤

  1. 编辑配置文件

    vi /etc/multipath.conf
    

    添加:

    devices {device {vendor              "HUAWEI"product             "XSG1"path_grouping_policy multibusprio                constpath_selector       "service-time 0"path_checker        turfailback            immediatedev_loss_tmo        30fast_io_fail_tmo    5no_path_retry       15}
    }
    
  2. 重启服务

    systemctl restart multipathd
    
  3. 验证

    • 查看多路径:multipath -ll,确认华为XSG1设备及路径状态(active,分组multibus)。
    • 模拟故障(如拔插光纤),检查日志(/var/log/messages),验证故障转移(failback生效,切换时间≤30秒)。
    • 监控I/O:iostat -xm 5,确认负载均匀(service-time 0策略生效)。

四、最佳实践

  1. 硬件冗余:双HBA卡、双交换机、双控制器,构建2×2冗余拓扑,抵御单硬件故障。
  2. 固件更新:升级HBA卡驱动与存储固件,确保ALUA(若适用)等特性正常。
  3. 监控告警:配置Zabbix/Prometheus,监控路径状态、故障次数,设置no_path_retrydev_loss_tmo告警。
  4. 定期演练:每季度模拟故障,验证故障转移时间(≤30秒),确保符合SLA。
  5. 配置备份:备份multipath.conf及存储映射文档,便于灾难恢复。

五、故障排除

  1. 路径未识别:检查日志(journalctl -u multipathd),确认vendor/product匹配;执行SCSI扫描(echo "- - -" > /sys/class/scsi_host/hostX/scan)。
  2. 负载不均:确认华为存储为Active/Active模式,检查HBA链路(ethtool/fcinfo),确保物理连通。
  3. 转移延迟:调整dev_loss_tmo(如20秒),验证存储故障恢复时间,协同failback策略。

通过上述配置,华为XSG1与RHEL多路径实现高可靠(99.99%可用性),适配生产环境。操作需结合华为与RHEL官方文档,确保版本兼容。

注意:实际部署需根据华为存储具体型号(如XSG1的ALUA支持情况)调整prio策略(如alua优先于const,若存储支持ALUA)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/907435.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unity开发之Webgl自动更新程序包

之前让客户端更新webgl程序是在程序里写版本号然后和服务器对比,不同就调用 window.location.reload(true);之前做的客户端都是给企业用,用户数少看不出来啥问题。后来自己开发一个小网站,用户数量还是挺多,然后就会遇到各种各样的…

一个开源脚本,可自动安装在 AMD Radeon 7900XTX 上运行选定 AI 接口所需的所有内容

​一、软件介绍 文末提供程序和源码下载 一个开源脚本,可自动安装在 AMD Radeon 7900XTX 上运行选定 AI 接口所需的所有内容。 二、ROCm-AI-Installer ROCm-AI-安装程序 一个开源脚本,可自动安装在 AMD Radeon 7900XTX 上运行选定 AI 接口所需的所有内…

【Axure结合Echarts绘制图表】

1.绘制一个矩形,用于之后存放图表,将其命名为test: 2.新建交互 -> 载入时 -> 打开链接: 3.链接到URL或文件路径: 4.点击fx: 5.输入: javascript: var script document.createEleme…

Relooking:损失权重λ 、梯度权重α、学习率η

一般多任务,大家都喜欢叠加很多损失,由此产生很多损失权重系数。此外,有的学者直接对梯度进行操作。咋一看,上面三个系数貌似重复多余,直接用其中一个系数代替不行吗?为此,回顾了下神经网络的前…

数学复习笔记 20

复习方程组,还有随便复习一下高数和矩阵,向量。现在是复习高数的导数这一章。两个曲线相切,列出方程,然后解出参数,没有任何难度呢。算切线方程,就是,算导数,导数就用导数定义&#…

Sqlalchemy 连mssql坑

连接失败: (pyodbc.OperationalError) (08001, [08001] [Microsoft][ODBC Driver 17 for SQL Server]SSL Provider: [error:0A00014D:SSL routines::legacy sigalg disallowed or unsupported] (-1) (SQLDriverConnect)) (Background on this error at: https://sqlalche.me/e/…

AI大模型学习三十、ubuntu安装comfyui,安装插件,修改返回405 bug,值得一看喔

一、说明 ComfyUI是一个开源的、基于节点的Web应用。它允许用户根据一系列文本提示(Prompt)生成图像。 ComfyUI使用扩散模型作为基础模型,并结合 ControlNet、Lora和LCM低阶自适应等模型,每个工具都由程序中的一个节点表示 二、开…

MySQL(40)如何使用DROP TABLE删除表?

DROP TABLE 语句用于从数据库中永久删除一个表及其所有数据。执行该语句后,表结构和数据都将被彻底删除,且无法恢复。因此,在执行 DROP TABLE 操作之前,请确保已备份好相关数据。 基本语法 DROP TABLE table_name;如果要删除多个…

element ui 表格 勾选复选框后点击分页不保存之前的数据问题

element ui 表格 勾选复选框后点击分页不保存之前的数据问题 给 el-table上加 :row-key"getRowKey"给type“selection” 上加 :reserve-selection"true"

vite常见面试问题

一、Vite 核心原理 1. Vite 为什么比 Webpack 快? 答案: Vite 的核心优势在于开发环境和生产环境的双重优化: 开发环境: 基于原生 ESM(ES Modules):浏览器直接加载 ES 模块,无需打包,启动时间极短(毫秒级)。按需编译:仅编译当前页面所需的模块,而非整个项目。预…

Screen 连接远程服务器(Ubuntu)

连接 1. 安装screen 默认预安装&#xff0c;可以通过命令查看&#xff1a; screen --version 若未安装&#xff1a; # Ubuntu/Debian sudo apt-get install screen 2. 本机连接远程服务器 ssh root192.168.x.x 在远程服务器中打开screen&#xff1a; screen -S <nam…

Flutter GridView网格组件

目录 常用属性 GridView使用配置 GridView.count使用 GridView.extent使用 GridView.count Container 实现列表 GridView.extent Container 实现列表 GridView.builder使用 GridView网格布局在实际项目中用的也是非常多的&#xff0c;当我们想让可以滚动的元素使用矩阵…

Jenkins实践(8):服务器A通过SSH调用服务器B执行Python自动化脚本

Jenkins实践(8):服务器A通过SSH调用服务器B执行Python自动化脚本 1、需求: 1、Jenkins服务器在74上,Python脚本在196服务器上 2、需要在服务器74的Jenkins上调用196上的脚本执行Python自动化测试 2、操作步骤 第一步:Linux Centos7配置SSH免密登录 Linux Centos7配置S…

C#二维码:利用 ThoughtWorks.QRCode 库实现二维码生成与解析

C#二维码&#xff1a;利用 ThoughtWorks.QRCode 库实现二维码生成与解析 在当今数字化信息交互频繁的时代&#xff0c;二维码凭借其信息容量大、容错能力强、易识别等特点&#xff0c;广泛应用于各个领域。从移动支付、产品溯源到活动签到&#xff0c;二维码无处不在。在 C# 开…

【Java Web】速通JavaScript

参考笔记:JavaWeb 速通JavaScript_javascript 速通-CSDN博客 目录 一、JavaScript快速入门 1. 基本介绍 2. JavaScript特点 3. JavaScript的引入方式(重要) 3.1 写在script标签中 ​​​​​3.2 以外部文件方式引入 二、JS的数据类型 1. 变量 2. 常用数据类型 3.特殊值 三、…

Python打卡训练营-Day13-不平衡数据的处理

浙大疏锦行 知识点&#xff1a; 不平衡数据集的处理策略&#xff1a;过采样、修改权重、修改阈值交叉验证代码 过采样 过采样一般包含2种做法&#xff1a;随机采样和SMOTE 过采样是把少的类别补充和多的类别一样多&#xff0c;欠采样是把多的类别减少和少的类别一样 一般都是缺…

Mac OS 使用说明

Mac 的启动组合键 了解可通过在启动时按住一个或多个按键来访问的 Mac 功能和工具。 若要使用这些组合键中的任何一个&#xff0c;请在按下电源按钮以开启 Mac 后或在 Mac 开始重新启动后&#xff0c;立即按住相应按键。请一直按住&#xff0c;直至电脑出现对应的行为。 !!!上…

LoadRunner 是什么

LoadRunner 是一款由 Micro Focus&#xff08;原惠普企业软件部门&#xff09;开发的性能测试工具&#xff0c;广泛应用于软件、应用程序和系统的 负载测试、压力测试 和 性能分析。它通过模拟大量用户并发操作&#xff0c;帮助测试人员评估系统在高负载下的性能、稳定性和可扩…

RISC-V PMA、PMP机制深入分析

1 PMA PMA&#xff08;Physical Memory Attributes&#xff09;&#xff0c;物理内存属性&#xff0c;顾名思义就是用来设置物理内存属性的&#xff0c;但这里说“设置”&#xff0c;并不合理&#xff0c;因为一般情况下各存储的属性&#xff0c;在芯片设计时就固定了&#xf…

SQL正则表达式总结

这里写目录标题 一、元字符二、正则表达函数1、 regexp_like(x,pattern[,match_option])2、 regexp_instr(x,pattern[,start[,occurrence[,return_option[, match_option]]]]) 3、 REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]]) 4、 REGEXP_REPLACE(x,patter…