Python实例题:文件内容搜索工具

目录

Python实例题

题目

要求:

解题思路:

代码实现:

Python实例题

题目

文件内容搜索工具

要求

  • 实现一个命令行工具,用于在指定目录下搜索包含特定文本的文件。
  • 支持以下功能:
    • 递归搜索子目录
    • 区分大小写 / 不区分大小写搜索
    • 搜索特定文件类型(如 .txt、.py)
    • 显示匹配行号和上下文
    • 统计匹配文件数和匹配行数
  • 添加进度显示和结果高亮功能。

解题思路

  • 使用 os.walk 递归遍历目录。
  • 通过正则表达式实现文本匹配。
  • 利用 ANSI 转义码实现终端文本高亮。

代码实现

import os
import re
import argparse
from pathlib import Path
from termcolor import colored
import progressbardef search_file(file_path, search_text, case_sensitive=True, context_lines=0):"""在单个文件中搜索文本,返回匹配结果"""matches = []try:with open(file_path, 'r', encoding='utf-8') as f:lines = f.readlines()for line_num, line in enumerate(lines, 1):if case_sensitive:if search_text in line:matches.append((line_num, line.strip()))else:if search_text.lower() in line.lower():matches.append((line_num, line.strip()))# 添加上下文if context_lines > 0 and matches:result_with_context = []for line_num, line in matches:start = max(1, line_num - context_lines)end = min(len(lines), line_num + context_lines)context = []for i in range(start, end + 1):context_line = lines[i-1].strip()is_match = i == line_numcontext.append((i, context_line, is_match))result_with_context.append(context)return result_with_contextelse:return [(m[0], [m]) for m in matches]except (UnicodeDecodeError, PermissionError) as e:print(f"无法读取文件 {file_path}: {e}")return []def search_directory(root_dir, search_text, file_extensions=None, case_sensitive=True, recursive=True, context_lines=0, progress_callback=None):"""在目录中搜索包含特定文本的文件"""total_matches = []file_count = 0match_count = 0# 准备文件扩展名筛选器if file_extensions:file_extensions = [ext.lower() if ext.startswith('.') else f'.{ext}' for ext in file_extensions]# 遍历目录for root, _, files in os.walk(root_dir):for filename in files:if file_extensions and not any(filename.lower().endswith(ext) for ext in file_extensions):continuefile_path = os.path.join(root, filename)matches = search_file(file_path, search_text, case_sensitive, context_lines)if matches:total_matches.append((file_path, matches))match_count += len(matches)file_count += 1if progress_callback:progress_callback()if not recursive:breakreturn total_matches, file_count, match_countdef highlight_text(text, search_text, case_sensitive=True):"""高亮显示匹配的文本"""if not case_sensitive:pattern = re.compile(re.escape(search_text), re.IGNORECASE)else:pattern = re.compile(re.escape(search_text))return pattern.sub(colored(r'\g<0>', 'red', attrs=['bold']), text)def main():parser = argparse.ArgumentParser(description='文件内容搜索工具')parser.add_argument('directory', help='搜索目录')parser.add_argument('search_text', help='要搜索的文本')parser.add_argument('-e', '--extensions', nargs='+', help='限制搜索的文件扩展名,例如: txt py')parser.add_argument('-i', '--ignore-case', action='store_true', help='忽略大小写')parser.add_argument('-r', '--recursive', action='store_true', help='递归搜索子目录')parser.add_argument('-c', '--context', type=int, default=0, help='显示匹配行的上下文行数')args = parser.parse_args()# 验证目录是否存在if not os.path.isdir(args.directory):print(f"错误: 目录 '{args.directory}' 不存在")return# 计算总文件数用于进度显示total_files = 0for root, _, files in os.walk(args.directory):if args.extensions:files = [f for f in files if any(f.lower().endswith(ext) for ext in args.extensions)]total_files += len(files)if not args.recursive:breakprint(f"在目录 '{args.directory}' 中搜索 '{args.search_text}'...")print(f"总文件数: {total_files}")# 创建进度条widgets = ['搜索进度: ', progressbar.Percentage(),' ', progressbar.Bar(marker='█', fill='-'),' ', progressbar.ETA()]bar = progressbar.ProgressBar(max_value=total_files, widgets=widgets).start()progress_counter = [0]  # 使用列表以便在闭包中修改def update_progress():progress_counter[0] += 1bar.update(progress_counter[0])# 执行搜索matches, file_count, match_count = search_directory(args.directory, args.search_text, args.extensions, not args.ignore_case, args.recursive, args.context,update_progress)bar.finish()# 显示结果print(f"\n搜索完成!")print(f"匹配文件数: {file_count}")print(f"匹配行数: {match_count}")if matches:print("\n匹配结果:")for file_path, file_matches in matches:print(f"\n{colored(file_path, 'blue', attrs=['underline'])}")for context in file_matches:for line_num, line_text, is_match in context:prefix = colored(f"{line_num:>5} | ", 'cyan')if is_match:line_text = highlight_text(line_text, args.search_text, not args.ignore_case)print(prefix + colored(line_text, 'yellow'))else:print(prefix + line_text)else:print("\n没有找到匹配的内容。")if __name__ == "__main__":main()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/912081.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/912081.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Pandas】pandas DataFrame resample

Pandas2.2 DataFrame Time Series-related 方法描述DataFrame.asfreq(freq[, method, how, …])用于**将时间序列数据转换为指定频率&#xff08;resample to frequency&#xff09;**的方法DataFrame.asof(where[, subset])用于查找时间序列中最接近指定时间点的非 NaN 值的…

自动驾驶nuPlan数据集-入门使用和可视化操作

文章目录 前言一、nuPlan 数据集下载及环境安装根据个人安装的路径将以下内容写入./bashrc 中二、跑通场景可视化总结 前言 自动驾驶行业知识点太多&#xff0c;不进则退&#xff0c;上班就得学习&#xff0c;天上掉金砖砸我脚好了 参考文档 参考&#xff11; 一、nuPlan 数据…

ApplovinMax接入Unity(包括我自己踩的一些坑)

前言 ApplovinMax是一个广告聚合平台&#xff0c;他会自带自己的Applovin平台广告&#xff0c;在这个插件上面你可以下载其他的聚合渠道&#xff0c;与谷歌的Admob比较相似。都是广告聚合平台。 一. ApplovinMax SDK插件的导入 1.下载插件集成 | SDK 集成指南 | MAX | Suppo…

linux系统执行过程中的5种特殊情况

正在执行的用户态X切换用户态进程Y的过程为系统中常用的情况&#xff0c;但并非不能完全准确地反应系统的全部执行场景&#xff0c;还有一些场景比较特殊&#xff0c;主要包括以下5种情况 一.内核线程之间通过中断处理过程中的调度时机发生进程切换&#xff0c;与一般的情况非常…

9. 元素拖拽

元素拖拽 API 介绍 1. 拖放过程 整个拖放过程中&#xff0c;存在两个关键元素&#xff1a;拖拽元素、放置元素 拖拽元素&#xff1a;被拖拽的元素 drag&#xff1a;元素被拖拽时触发&#xff0c;从开始拖拽到拖拽结束前整个过程会一直持续的触发dragstart&#xff1a;元素被…

用来提升同花顺软件进程优先级的C#程序

为了提高炒股软件同花顺的运行速度&#xff0c;消除卡顿&#xff0c;编写一个C#程序&#xff0c;来设置同花顺进程的优先级。 using System; using System.Diagnostics; using System.Security.Principal;namespace ProcessPrioritySetter {class Program{static void Main(st…

linux初阶---一些指令

一.快速认识6-8个简单指令 1.pwd pwd指令是用来查看用户当前所处在的目录&#xff08;目录的概念在理解上可以等效为文件夹&#xff09;。 &#xff08;1&#xff09;在windows系统中我们通过文件路径表示唯一的文件&#xff0c;在linux中也是一样的&#xff0c;所以pwd是一个很…

全国产传感器外壳的综合分析:材料选择、考量因素与尺寸精度影响

全国产传感器作为现代工业、科研、生活等领域的 “感知触角”&#xff0c;其外壳的性能与质量直接关乎设备的稳定性、可靠性与使用寿命。从材料选型、关键考量因素到尺寸精度的影响&#xff0c;每个环节都需精细把控。 一、全国产传感器外壳材料的多元选择 全国产传感器外壳材…

本地缓存Caffeine详解(含与Spring Cache集成)

目录 一、介绍 二、Caffeine核心原理与架构设计 2.1 存储引擎与数据结构 2.2 缓存淘汰策略 2.3 并发控制机制 三、入门案例 3.1 引入依赖 3.2 测试接口 3.3 小结 四、Caffeine常用方法详解 4.1 getIfPresent 4.2 get 4.3 put 4.4 putAll 4.5 invalidate 4.6 inv…

论特定领域软件架构

20250413-作 题目 特定领域软件架构DSSA&#xff08;Domain Specific Software Architecture&#xff09;就是在一个特定应用领域中为一组应用提供组织结构参考的标准软件体系结构。对DSSA 研究的角度、关心的问题不同导致了对DSSA 的不同定义。DSSA 的必备特征如下。 一…

iOS 远程调试与离线排查实战:构建非现场问题复现机制

iOS开发者都知道&#xff0c;调试最怕两个字&#xff1a;“偶发”。用户说App闪退了&#xff0c;你点了十遍也没问题&#xff1b;测试说功能卡顿了&#xff0c;你抓日志时它又顺滑如新。最麻烦的是&#xff0c;这种“现场问题”往往在你连接不到用户设备时发生。 面对这种情况…

SpringBoot -- 整合 Swagger3

8.SpringBoot3 整合 Swagger3 由于目前主流的开发模式是前后端分离开发。所以前后端的交互需要通过一个 API&#xff08;开发接口&#xff09; 来规范。而这个接口的开发是由后端程序员编写的。“网站式 API 文档” 1.导入依赖 <!-- 引入swagger3(springdoc)的依赖--> …

A Machine Learning Approach for Non-blind Image Deconvolution论文阅读

A Machine Learning Approach for Non-blind Image Deconvolution 1. 研究目标与实际意义2. 创新方法与模型设计2.1 核心思路2.2 正则化反演:理论与公式2.2.1 退化模型2.2.2 正则化目标函数2.2.3 傅里叶域闭式解2.3 MLP去伪影:架构与训练2.3.1 MLP架构设计2.3.2 训练流程2.3.…

微信小程序<rich-text>支持里面图片点击放大

使用<rich-text>渲染类似下面的html代码&#xff1a; <div stylecolor: red>宠物友好<br/>xxx提供宠物友好服务&#xff0c;具体请见下图<br/></div> <img srchttps://xxx.com/xxx1.png width100%/> <img srchttps://xxx.com/xxx2.png…

BVH 文件是一种用于记录 3D 动画数据的文件格式,常用于 3D 建模和动画制作。以下是对这个 BVH 文件的逐行解读

BVH 文件是一种用于记录 3D 动画数据的文件格式&#xff0c;常用于 3D 建模和动画制作。以下是对这个 BVH 文件的逐行解读&#xff1a; HIERARCHY ROOT Hips { OFFSET 0 0 0 CHANNELS 6 Xposition Yposition Zposition Zrotation Xrotation Yrotation JOINT LeftUpLeg { OFFSE…

C语言开发:Onvif(一)

根据ONVIF官网 的介绍&#xff1a; ONVIF是一个开放的安防行业组织&#xff0c;致力于为安防行业提供和促进标准化开放接口&#xff0c;以实现IP网络安防产品和服务的有效互操作性。 在具体实现上&#xff0c;ONVIF使用了Web Service的方式&#xff0c;设备通过WSDL定义的接口…

中科米堆三维扫描仪耳机3D扫描尺寸测量数字化建模

当下&#xff0c;耳机已从单纯的音频输出设备进化为集娱乐、健康、办公于一体的智能穿戴终端。相关数据显示&#xff0c;2025年全球智能个人音频设备出货量突破4.55亿台&#xff0c;中国以22%的增速领跑全球&#xff0c;其中开放式耳机&#xff08;OWS&#xff09;出货量占比达…

学习接口自动化框架pytest有哪些好处?

学习 pytest 作为接口自动化测试框架&#xff0c;具有以下显著优势&#xff0c;能大幅提升测试效率和质量&#xff1a; Pytest自动化测试教程&#xff0c;自动化必备之Pytest测试框架训练营&#xff0c;只需一小时速成&#xff0c;学会直接上手实操&#xff01; 1. 代码简洁&…

LinuxBridge的作用与发展历程:从基础桥接到云原生网络基石

LinuxBridge作为Linux网络虚拟化的核心组件&#xff0c;已悄然支撑互联网基础设施20余年。它不仅是虚拟机网络连接的桥梁&#xff0c;更是容器网络、云原生架构的隐形支柱。 一、LinuxBridge的核心作用剖析 1. 二层网络虚拟化的实现者 本质功能&#xff1a;模拟物理交换机行为…

探讨 SYSCFG 时钟对 ADC 采样的影响

探讨 SYSCFG 时钟对 ADC 采样的影响 在嵌入式系统开发中&#xff0c;对于 GD32F4 系列微控制器&#xff0c;理解 SYSCFG 时钟与 ADC 采样之间的关系至关重要。 以下是详细分析&#xff1a; 一、SYSCFG 时钟对 ADC 采样过程的基础性作用 1. 提供采样时钟信号 ADC 采样需要时钟…