【fitz+PIL】PDF图片文字颜色加深

文章目录

    • 0 引言
    • 1 解决思路及流程
      • 1.1 思路
      • 1.2 代码实现
    • 2 完整代码与效果
    • 3 总结

0 引言

没错,这是连续剧。女友对上一篇【fitz+OpenCV】去除PDF图片中的水印得到的去水印效果很满意,于是问我可不可以再帮她处理一下另一个PDF文件,我二话不说答应了下来。原PDF文件是一本教材的电子版,每页都是一张图片,和上一篇文章中PDF的类型相同,不过本文中需要解决的问题是,原图中文字颜色太浅,看着费眼睛,如下图所示,需要将文字颜色加深。

image-20250710203703384

1 解决思路及流程

1.1 思路

在大致分析了PDF组成后(其中红色的为笔记标注,和页面图片单独存在),这个问题的解决思路也相当明晰了,便是将每页的图片单独提取出来,对图片进行文字加深处理,这里可以通过增加图片对比度实现(对比度就是画面中明暗部分的亮度比,对比度越高,则图像中明暗部分的差异就越大。根据这一原理,将对比度增大后,原本颜色较深的文字部分将会更深,反之,颜色较浅的背景将会更亮)。

1.2 代码实现

在代码方面中,我们依然采用fitzpip install PyMuPDF)作为PDF处理库,图片的处理则是基于图像库PILpip install pillow)。

首先我们打开待处理的PDF文件,对每页进行遍历,提取每页的图片,为了防止个别页面存在多张图片,又嵌套了个for循环以遍历页内图片。

doc = fitz.open(input_pdf)  # 打开原PDF
for page_num in range(len(doc)):# 获取页面图片page = doc.load_page(page_num)page_imgs = page.get_images()for page_img in page_imgs:xref = page_img[0]img_info = doc.extract_image(xref)img = Image.open(io.BytesIO(img_info["image"]))  # 转换为 PIL Image,方便处理

接下来处理每张图片,factor为对比度值,取1函数返回原图像,如果要增加图像对比度,该参数应大于1.0,本文示例中取3.0。

# 增强图片
enhancer = ImageEnhance.Contrast(img)  # 增强对比度(使文字更清晰)
enhanced_img = enhancer.enhance(factor=contrast)

用增强后的图片替换原图片,这一步仅仅改变了背景图片的信息,不影响前景的笔记标注。其中quality参数用于控制图像的质量,决定图像的体量与清晰度,progressive用于控制是否生成渐进式JPEG,实测该保存方式得到的图片体积更小,dpi参数用于控制图片两个方向的dpi。

# 替换原图片
bio = io.BytesIO()
enhanced_img.save(bio, format=img_info["ext"], quality=50, progressive=True, dpi=(300, 300))
page.replace_image(xref, stream=bio)

最后一步,在所有页面处理完成后,保存输出处理后的PDF。

# 保存PDF
doc.save(output_pdf)
doc.close()

2 完整代码与效果

完整代码如下:

import io
import fitz  # PyMuPDF
from PIL import Image, ImageEnhancedef process_pdf(input_pdf, output_pdf, contrast):doc = fitz.open(input_pdf)  # 打开原PDFfor page_num in range(len(doc)):# 获取页面图片page = doc.load_page(page_num)page_imgs = page.get_images()for page_img in page_imgs:xref = page_img[0]img_info = doc.extract_image(xref)img = Image.open(io.BytesIO(img_info["image"]))  # 转换为 PIL Image,方便处理# 增强图片enhancer = ImageEnhance.Contrast(img)  # 增强对比度(使文字更清晰)enhanced_img = enhancer.enhance(factor=contrast)# 替换原图片bio = io.BytesIO()enhanced_img.save(bio, format=img_info["ext"], quality=50, progressive=True, dpi=(300, 300))page.replace_image(xref, stream=bio)# 保存PDFdoc.save(output_pdf)doc.close()print(f"PDF处理完成!输出文件: {output_pdf}")if __name__ == "__main__":input_pdf = 'example.pdf'output_pdf = 'output.pdf'process_pdf(input_pdf, output_pdf, contrast=3.0)

处理效果如下图所示:

image-20250710212242933

效果还是不错的。

3 总结

该方法和上一篇文章中的方法存在一个共性问题,便是生成的PDF文件体量太大,比原本文件的大了近3~4倍,该问题打算后面有时间研究一下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/88664.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/88664.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

tp8.0\jwt接口安全验证

环境&#xff1a;php8.3\tp8.1\firebase-jwt6.1app\middleware\JwtAuth<?php namespace app\middleware;use app\common\library\JwtHandler; use think\Request; use think\facade\Env;class JwtAuth {public function handle(Request $request, \Closure $next){// 获取当…

ReactNative【实战系列教程】我的小红书 5 -- 文章详情(含轮播图 ImageSlider,点亮红心动画 Heart,嵌套评论等)

最终效果 安装依赖 npm i dayjs用于对时间进行格式化 必备组件 轮播图 ImageSlider https://blog.csdn.net/weixin_41192489/article/details/149224510 点亮红心动画 Heart components/Heart.tsx import AntDesign from "expo/vector-icons/AntDesign"; import …

哔哩哔哩第三方TV-BBLL最新版

—————【下 载 地 址】——————— 【​本章下载一】&#xff1a;https://pan.xunlei.com/s/VOUtUcaymd9rpgurgDKS9pswA1?pwdp76n# 【​本章下载二】&#xff1a;https://pan.xunlei.com/s/VOUtUcaymd9rpgurgDKS9pswA1?pwdp76n# 【百款黑科技】&#xff1a;https://uc…

用YOLOv5系列教程(1)-用YOLOv5轻松实现设备状态智能监控!工业级教程来了

用YOLOv5轻松实现设备状态智能监控&#xff01;工业级教程来了设备运维革命&#xff1a;15分钟教会你的摄像头看懂指示灯状态工业现场各种设备状态指示灯是工程师的"眼睛"——红灯报警、绿灯运行、黄灯待机。但人工巡检耗时费力&#xff0c;关键故障容易漏检&#xf…

笔记-分布式计算基础

Distributed Computing 划分数据并行&#xff08;DataParallelism&#xff09;将数据分为n份&#xff0c;发送到n个GPU上&#xff0c;每个GPU上都存在一个完整的大模型 缺点&#xff1a; 模型太大Pipeline Parallelism&#xff08;串行的&#xff09;将模型做split,每个GPU负责…

Android Studio 2024,小白入门喂饭级教程

一、下载Android Studio 1、从安卓官网安卓官网下载Android Studio。 ​ ​ 二、安装Android Studio 1、双击android-studio-2024.3.2.15-windows.exe。 ​ ​​ ​ ​ ​ ​ 三、新建工程 1、双击桌面图标​ 打开Android Studio。 ​ 选“Empty Views Activity…

AI智能体 | 使用Coze制作一键生成单词洗脑循环视频,一天批量生成100条视频不是梦!(附保姆级教程)

目录 一、整体工作流设计 二、制作工作流 2.1 开始节点 2.2 大模型-单词 2.3 大模型_图像生成 2.4 输出 2.5 图像生成_1 2.6 输出_2 2.7 画板_2 2.8 文本处理 2.9 输出_3 2.10 speech_synthesis_1x5 2.11 get_audio_duration_1 2.12 代码 2.13 get_audio_durati…

质量属性场景(Quality Attribute Scenario)深度解析

本质定义:质量属性场景(Quality Attribute Scenario)是精确描述软件系统质量要求的结构化方法,通过标准化的场景模板将抽象的质量属性转化为可测量、可验证的具体行为描述,为架构设计提供客观评估基准。 一、质量属性场景核心结构 1. 六元组标准模板 #mermaid-svg-AGbvPVRu…

Java_Springboot技术框架讲解部分(一)

首先讲解一下&#xff1a;Java技术栈中&#xff0c;目前Spring Boot在国内的关注趋势也日渐超过Spring。Spring Boot是Spring家族中的一个全新的框架&#xff0c;它用来简化Spring应用程序的创建和开发过程。采用Spring Boot可以非常容易和快速的构建基于Spring框架的应用程序&…

从OpenMV到执行器:当PID算法开始“调教”舵机

如果到现在还不会驱动舵机——朋友&#xff0c;电赛的元器件清单每年都在对你“明示”&#xff0c;二维云台都快成祖传考题了&#xff01;补课&#xff1f;现在&#xff01;立刻&#xff01;&#xff08;当然&#xff0c;如果你脸皮够厚&#xff0c;也可以私信骚扰作者&#xf…

xml映射文件的方式操作mybatis

映射文件 在Java spring中使用mybatis有两种方式&#xff0c;一种是注释的方式&#xff0c;一种是xml映射文件的方式。在简单的功能需求可以使用注释&#xff0c;方便简洁。而在大的功能逻辑上&#xff0c;更推荐使用xml映射文件&#xff0c;方便管理且结构清晰。 首先xml文件结…

Carla自动驾驶仿真_快速安装与运行Carla

大家好&#xff0c;我是橙子&#xff0c;今天给大家介绍Carla的基础安装和使用 目录 1.Carla介绍 2.Carla的安装与使用 3.Carla0.9.15安装包下载&#xff1a; ​编辑 4.运行Demo 5.运行一个简单场景&#xff1a; 6.相关资源 1.Carla介绍 Carla 是一个开源的自动驾驶仿…

远程登录docker执行shell报错input is not a terminal问题

背景 最近要远程去k8s docker里面获取信息&#xff0c;于是&#xff0c;写了一个如下的命令&#xff0c;执行完之后&#xff0c;报错了。 ssh 192.168.100.2 sudo crictl exec -it xxx.docker /usr/bin/lscpu --online --extended错误信息如下&#xff1a; time“2025-07-11T21…

使用FastAdmin框架开发二

继上一篇使用FastAdmin框架开发-CSDN博客教程 部署完项目后我们就可以边开发边调试了 在开发前我们可以先做一些基本设置 安装成功后会生成一个项目后台的地址http://域名/VrHGtzlfMB.php/index/login&#xff0c;后台入口文件是随机生成的&#xff0c;当然我们也可以根据我…

【DB2】load报错SQL3501W、SQL3109N、SQL2036N

最近老遇到迁移测试LOAD时报错&#xff0c;如图所示但是换成import又可以看描述是说load的内容将不会进入备份暂挂状态balbala… 下面的错误是说ixf文件无效 这里一直以为是SQL3501W的问题&#xff0c;去各种研究load参数和db2set里面的load参数&#xff0c;各种调整都不行 又以…

YOLO家族内战!v5/v8/v10谁才是你的真命天子?(附保姆级选择指南)

在目标检测领域&#xff0c;YOLO系列始终是工业部署与学术研究的焦点。从风靡全网的YOLOv5&#xff0c;到全面升级的YOLOv8&#xff0c;再到突破性能瓶颈的YOLOv10——每一次迭代都带来全新可能。作为开发者&#xff0c;究竟该选哪一代&#xff1f;本文用千字长文对比表格为你彻…

Claude Code是什么?国内如何使用到Claude Code?附国内最新使用教程

2025年已过大半&#xff0c;相信你也听说过 Claude——它是近年最受关注的 AI 模型之一&#xff0c;而 Claude Code 则是它面向编程场景的特别版本&#xff0c;专为代码理解、生成与重构而生&#xff0c;尤其擅长处理大项目、长上下文&#xff0c;和开发者对话更自然。 但对于一…

双轮驱动:政策激励与外部制约下的国产服务器市场演进

2025年6月&#xff0c;科智咨询正式发布《中国国产服务器市场研究报告&#xff08;2025&#xff09;》&#xff0c;报告从国产服务器产业概述、政策环境分析、市场现状与竞争格局、面临挑战与市场机遇等维度&#xff0c;深入剖析国产服务器市场现状及未来发展趋势。2022年10月&…

【工具变量】全国省市区县土地出让结果公告数据(2000-2024年)

土地出让结果公告数据是指政府主管部门在完成国有土地使用权出让后&#xff0c;依法依规对外公开的结果信息&#xff0c;涵盖土地出让时间、出让方式、竞得人、成交价、用地性质、面积等关键信息。土地出让数据是研究中国土地市场供需变化、城市发展轨迹以及地方财政收入结构的…

前端面试专栏-算法篇:22.树结构(二叉树、B树、红黑树)

&#x1f525; 欢迎来到前端面试通关指南专栏&#xff01;从js精讲到框架到实战&#xff0c;渐进系统化学习&#xff0c;坚持解锁新技能&#xff0c;祝你轻松拿下心仪offer。 前端面试通关指南专栏主页 前端面试专栏规划详情 树结构&#xff08;二叉树、B树、红黑树&#xff09…