删除 XML 格式中双引号内的空格

要使用 Shell 命令删除 XML 格式中双引号内的空格(仅处理属性值中的空格,保留标签外的空格),可以使用以下 sed 命令

sed -i ':loop; s/\("[^"]*\) \([^"]*"\)/\1\2/g; t loop' filename.xml

命令详解:

  1. 核心逻辑

    • s/\("[^"]*\) \([^"]*"\)/\1\2/g
      匹配双引号内的内容,将捕获分组 \1(双引号后到空格前的文本)和 \2(空格后到双引号结束的文本)合并,从而删除一个空格。
    • :loop; t loop
      通过循环重复执行替换,直到一行中所有双引号内的空格都被删除。
  2. 关键特性

    • 仅处理属性值(如 name="John Doe"name="JohnDoe"),标签外的空格(如缩进、换行)保留不变。
    • 支持一行内多个属性(如 <tag a="val 1" b="val 2"><tag a="val1" b="val2">)。

示例验证:

输入 XML

<data><item name="Product 123" price="100 USD"/><info desc="A test example" />
</data>

执行命令后

<data><item name="Product123" price="100USD"/><info desc="Atestexample" />
</data>

系统适配:

  • Linux/macOS(BSD sed)
    直接运行上述命令(macOS 需先安装 GNU sed,或改用 sed -i '' '...')。
  • Windows(Git Bash/WSL)
    确保在 Bash 环境中运行,语法相同。

注意事项:

  1. 不处理转义双引号
    若属性值包含转义双引号(如 \"),此命令可能出错。复杂 XML 建议使用专业解析器(如 xmlstarlet)。
  2. 备份文件
    首次使用建议先备份文件,或去掉 -i 测试输出:
    sed ':loop; s/\("[^"]*\) \([^"]*"\)/\1\2/g; t loop' filename.xml
    

替代方案(简单场景):

若空格仅出现在属性值中间(非开头/结尾),可用简化命令:

sed -i 's/\(="[^"]*\) /\1/g' filename.xml

此方法基于 Shell 文本处理逻辑,通过循环替换解决边界问题。对于含转义或嵌套结构的 XML,推荐使用专用工具如 xmlstarlet


相关问题

  1. 如何保留属性值中的特定空格(如英文单词间的单个空格)?
  2. 使用 awk 处理 XML 文件时,如何安全删除双引号内的空格?
  3. 若 XML 属性值包含转义字符(如 &quot;),应如何避免解析错误?
: 引用[2]: shell中空格的使用;空格替换;通配符。空格替换 将多个空格替换为一个空格 sed ‘s/[ ][ ]/ /g’ filename sed -e 's/[[:space:]][[:space:]]/ /g’ filename 将1到10个空格替换为一个空格 sed ‘s/[ ]{1,10}/ /g’ filename 去掉多余空格 echo “hello world” | tr -s ‘[[:space:]]’ http://www.runoob.com/linux/linux-comm-tr.html http://wiki.jikexueyuan.com/project/unix/regular-expressions.html
引用[1]:【Shell】Sed 删除、替换、增加字符串。方式3: 使用单引号,变量直接引用,但是需要通过 eval 执行这个sed命令。eval会对后面Shell命令进行两遍扫描,如果第一遍扫描后,Shell命令是个普通命令,则执行此命令;如果Shell命令是含有变量的间接引用,则保证间接引用的语义 #!/bin/bash name=tomas eval sed -i ‘s/rose/${name}/g’ name.txt 变量中存在特殊字符处理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/90183.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/90183.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电脑声音修复?【图文详解】电脑没有声音?声音异常

一、问题背景 在使用电脑的过程中&#xff0c;声音异常是很常见的问题。比如明明打开了音频文件&#xff0c;却听不到任何声音&#xff1b;或者声音忽大忽小、伴有杂音&#xff1b;或者更新了声卡驱动后&#xff0c;电脑播放不了声音了&#xff1b;还有可能是插入耳机后&#x…

【文献笔记】ARS: Automatic Routing Solver with Large Language Models

ARS: Automatic Routing Solver with Large Language Models https://github.com/Ahalikai/ARS-Routbench/ ARS&#xff1a;基于大语言模型的自动路由求解器 1. 概述 1.1. 研究背景 车辆路径问题&#xff08;VRP&#xff09;是一类经典的组合优化问题&#xff0c;广泛应用于…

RK3568笔记九十:基于web显示RTSP流

若该文为原创文章,转载请注明原文出处。 在网上看到个方案,使用web显示RTSP视频流,思路是前端传入RTSP地址,cgi通过FFMPEG接收RTSP流并保存成avi文件,在通过ffmpeg 命令把avi文件保存成mp4文件,前端在播放mp4文件。此方案需要先保存文件,在转换文件,无法实时播放。 所以…

2025年Flutter开发主流技术栈

2025年Flutter开发主流技术栈 Flutter作为一种高效、跨平台的移动应用开发框架&#xff0c;近年来在开发者社区中越来越受欢迎。以下是2025年Flutter开发的主流技术栈&#xff0c;涵盖了从核心框架到开发工具、状态管理、数据存储等多个方面。 1. 核心框架 Flutter&#xff1a;…

Qt 常用控件 - 1

控件概述 编程讲究的是 --- 站在巨人的肩膀上 --- 不是编写一个图形化界面上的内容 --- Qt 已经提供了很多控件了&#xff01;&#xff01;&#xff01;提高图形化界面的开发效率&#xff01;&#xff01;&#xff01;重点变成我们怎么使用这些已有的控件&#xff01; Widge…

springdoc-openapi-ui的使用教程

<dependency><groupId>org.springdoc</groupId><artifactId>springdoc-openapi-ui</artifactId><version>1.6.14</version> </dependency>springdoc-openapi-ui 是一个用于生成 OpenAPI 文档的库&#xff0c;它与 Swagger 的关…

【硬件-笔试面试题】硬件/电子工程师,笔试面试题-3,(运放/三极管)

目录 1、题目 2、解答 【硬件-笔试面试题】硬件/电子工程师&#xff0c;笔试面试题-3&#xff0c;&#xff08;运放/三极管&#xff09; 这是一道大疆的笔试题 1、题目 2、解答

SQL Server 数据类型的含义、特点及常见使用场景的详细说明

数值类型 bigint 含义:用于存储大范围的整数,是 8 字节(64 位)有符号整数类型。 范围:-9,223,372,036,854,775,808 到 9,223,372,036,854,775,807 。 场景:适合存储像订单编号(可能很大)、系统中需要大范围计数的标识等,比如大型系统中大量数据的主键自增列(数据量极…

WPF的一些基础知识学习记录

路由事件 路由事件(Routed Event)是WPF事件系统的核心&#xff0c;它允许事件在元素树中传播&#xff0c;而不仅仅局限于引发事件的对象。包含以下三类&#xff1a;类型方向触发顺序典型用途示例事件​​直接事件(Direct Event)​​不路由只在源元素触发类似传统.NET事件MouseE…

【补题】Codeforces Round 1000 (Div. 2) C. Remove Exactly Two

题意&#xff1a;给一个树&#xff0c;可以从里面删去两个点&#xff0c;使连通块数量最大 思路&#xff1a;题解&#xff1a;CF2063C Remove Exactly Two - 洛谷专栏 这道题很容易想到&#xff0c;直接删去度最多的两个点就行了&#xff0c;但是这并不对&#xff0c;因为相邻…

基于php的校园招聘平台

学生&#xff1a;注册&#xff0c;登录&#xff0c;个人中心&#xff0c;学生应聘管理&#xff0c;面试邀请管理企业&#xff1a;登录&#xff0c;个人中心&#xff0c;招聘信息管理&#xff0c;学生应聘管理&#xff0c;面试邀请管理管理员&#xff1a;登录&#xff0c;个人中…

在 Ubuntu 22.04 上运行 cAdvisor 时遇到 mountpoint for cpu not found 错误

通常是由于 cgroup v2 导致的兼容性问题。Ubuntu 22.04 默认使用 cgroup v2&#xff0c;而旧版本的 cAdvisor 可能不完全支持它。以下是解决方案&#xff1a;方法 1&#xff1a;启用 cgroup v1&#xff08;推荐&#xff09;临时切换回 cgroup v1&#xff08;cAdvisor 兼容性更好…

如何让RAGFLow每次知识检索都是返回知识库中的所有文档?

在使用raglfow过程中,有时候输入的文本检索为空,要么就是只返回几条.如果想要看到所有知识库里文本返回,就得需要去到源码里修改这个参数minimum_should_match(路径:rag/utils/es_conn.py),将其设置为0%,即可返回所有文本!!

「iOS」——KVO

源码学习iOS底层学习&#xff1a;KVO 底层原理KVO注册 KVO 监听 实现 KVO 监听 移除 KVO 监听 处理变更通知 手动KVO(禁用KVO)关闭自动通知手动实现 setter 方法KVO 和线程如果 KVO 是多线程的**单线程的保证**如果没有 prior 选项**prior 选项的作用**KVO 实现原理派生类重写的…

Unreal5从入门到精通之使用 Python 编写虚幻编辑器脚本

文章目录 前言 如何运行Python 1.控制台 2.蓝图调用python python 入门 变量 数据类型 运算符 条件判断 循环 函数 模块引用 类型转换 类 类方法 继承 构造函数 unreal API 创建材质 创建材质实例 获取Content下选中资源 获取关卡中选中Actors 放置Cube 编辑器进度条 展示对话框…

Django3 - Web前端开发基础 HTML、CSS和JavaScript

网站开发可以分为前端开发和后端开发&#xff0c;前端开发是指网页设计&#xff0c;我们在浏览器看到网站的图片、文字、音乐视频等内容排版都是由前端开发人员实现的&#xff1b;后端开发是为前端开发提供实际的数据内容和业务逻辑&#xff0c;比如提供文字内容、图片和音乐视…

Nginx和Apache的区别

一。Nginx和Apache的优缺点和对比Nginx 优点Apache 优点性能与并发采用事件驱动模型&#xff0c;支持 10 万 高并发连接&#xff0c;资源&#xff08;CPU / 内存&#xff09;占用极低生态成熟&#xff0c;内置模块可直接处理动态内容&#xff0c;无需依赖第三方程序配置与部署…

前端实现可编辑脑图的方案

前端实现可编辑脑图的方案 实现可编辑脑图(Mind Map)在前端有多种方案&#xff0c;以下是一些主流的技术方案&#xff1a; 1. 基于现有开源库的方案 JavaScript 库 MindElixir: 轻量级开源脑图库&#xff0c;支持节点增删改、拖拽、导入导出等 GitHub: https://github.com/sssh…

7-大语言模型—指令理解:指令微调训练+模型微调

目录 1、指令微调的训练过程 2、指令微调数据 2.1、“指令输入” 2.2、“答案输出” 3、指令微调数据的构建方法 3.1、手动构建&#xff1a;纯人工 “出题 写答案” 3.1.1、构建流程 3.1.1.1、定义任务类型 3.1.1.2、设计指令模板 3.1.1.3、人工标注响应 3.1.2、工…

服务器版本信息泄露-iis返回包暴露服务器版本信息

漏洞信息描述&#xff1a;服务器版本信息泄露 测试过程&#xff1a;访问http://192.168.23.63&#xff0c;看返回包可以得知服务器版本信息 显示暴露返回server版本信息 修复建议&#xff1a;限制返回包带有服务器版本信息 如何隐藏IIS Web服务响应头中的IIS Server版本信息…