pdf删除一页 python实现(已验证)

首先安装库

使用PyPDF2

首先,确保你已经安装了PyPDF2。如果没有安装,可以通过pip安装:

pip install PyPDF2

然后运行

import PyPDF2def remove_page(input_pdf_path, output_pdf_path, page_number_to_remove):# 打开PDF文件with open(input_pdf_path, 'rb') as file:reader = PyPDF2.PdfFileReader(file)writer = PyPDF2.PdfFileWriter()# 遍历所有页面,除了要删除的页面for page_num in range(reader.numPages):if page_num != page_number_to_remove:writer.addPage(reader.getPage(page_num))# 写入新的PDF文件with open(output_pdf_path, 'wb') as output_file:writer.write(output_file)# 示例用法
input_pdf = 'example.pdf'
output_pdf = 'example_modified.pdf'
page_number_to_remove = 1  # 例如,删除第二页(索引从0开始)
remove_page(input_pdf, output_pdf, page_number_to_remove)

方法二

使用PDFPlumber

如果你更倾向于使用PDFPlumber(虽然它主要用于提取文本而不是直接操作页面),你首先需要安装它

安装库

pip install pdfplumber

但是,PDFPlumber本身不直接支持删除页面。你可以先用它提取页面,然后使用PyPDF2或其他方法重新组合页面。例如:

import pdfplumber
import PyPDF2def remove_page_with_pdfplumber(input_pdf_path, output_pdf_path, page_number_to_remove):# 使用PDFPlumber提取页面内容(可选,仅用于示例)pages = pdfplumber.extract_pages(input_pdf_path)extracted_pages = [pages[i] for i in range(len(pages)) if i != page_number_to_remove]# 使用PyPDF2重新组合页面并保存新的PDF文件writer = PyPDF2.PdfFileWriter()for page in extracted_pages:page_obj = PyPDF2.pdf.PageObject.createBlankPage(None, width=page.width, height=page.height)writer.addPage(page_obj)writer._writePageElement(writer._addObject(page.data), page_obj)  # 这里简化处理,实际使用时可能需要更精细的控制with open(output_pdf_path, 'wb') as f:writer.write(f)# 示例用法
input_pdf = 'example.pdf'
output_pdf = 'example_modified.pdf'
page_number_to_remove = 1  # 例如,删除第二页(索引从0开始)
remove_page_with_pdfplumber(input_pdf, output_pdf, page_number_to_remove)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/87171.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/87171.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025.1版本PyCharam找不到已存在的conda虚拟环境

前言 创建Python项目指定conda虚拟环境是最常用的操作,我下载的2025.1版本PyCharam编译器找不到我已经创建好的conda虚拟环境,解决方法如下 目录 问题描述 问题解决 总结 问题描述 我使用2025.1版本PyCharam编译器创建项目指定已经存在的虚拟环境出现如下情景 说是我没有…

开机启动项在哪里设置 实用步骤分享

电脑开机时,系统会自动运行一系列程序,其中包括必要的系统进程和用户自行添加的启动项。然而,过多的启动项可能会导致开机速度变慢,影响系统性能。因此,合理管理开机启动项,可以优化电脑的运行效率。电脑开…

LeetCode--39.组合总和

前引:明天就考最后一趟考试,最近考试周,我时时断更,从明天开始,就会一直更新了,可以期待一下 解题思路: 1.获取信息: 给定一个无重复的整数数组和一个目标值 从数组中选取任意数量的…

Visual Studio2022和C++opencv的配置保姆级教程

1.c桌面开发和windows平台开发(Visual Studio2022安装时) 2.下载OPenCV 3.系统属性→添加环境变量→Path 4.VS2022配置opencv 5.项目→属性→VC目录中的包含目录和库目录 5.项目→属性→VC目录中的包含目录和库目录 包含 目录添加: D:\…

使用Ansible的playbook安装HTTP

实验环境 安装好ansible 一、准备测试服务(192.168.10.41) 1、安装HTTP服务 dnf -y install httpd 2、启动HTTP服务 systemctl start httpd 3、使用浏览器访问 192.168.10.41 因为开启了防火墙,所有无法访问 4、开放防火墙的80端口 …

V少JS基础班之第六弹

一、 前言 第六弹内容是闭包。 距离上次函数的发布已经过去了一个多月, 最近事情比较多,很少有时间去写文章, 低质量还得保证所以本章放草稿箱一个月了,终于补齐了,其实还有很多细节要展开说明,想着拖太久…

【面板数据】全国高频交易明细数据(2000-2024.7)

中国土地交易市场作为国家宏观调控的重要组成部分,其通过市场机制,使土地使用权在不同主体间流转,将土地资源配置给最具利用效率的部门或企业,提升土地利用率和经济产出。中国土地高频交易明细数据汇集了全国范围内2000-2024年7月…

MongoDB 常用增删改查方法及示例

MongoDB 的增删改查(CRUD)操作是其核心功能,主要通过 mongo shell 或驱动(如 Node.js、Python 等)实现。以下是最常用操作的详细说明及示例(基于 mongo shell 语法)。 ​一、插入操作&#xff…

moodle升级(4.5到5.0)

升级目标 由Moodle 4.5 (Build: 20241129) 升级到Moodle 5.0.1 (Build: 20250629) 参考教程:moodle升级(详细版)-CSDN博客 操作平台:宝塔 通过宝塔进行备份 备份文件 将/www/wwwroot/moodle 和/www/wwwroot/moodledata 复制…

基于Apache POI实现百度POI分类快速导入PostgreSQL数据库实战

## 引言:POI数据的价值与挑战 POI(Point of Interest)数据作为地理信息系统的核心要素,在智慧城市、位置服务、商业分析等领域具有重要价值。百度POI数据包含了丰富的地点信息(如名称、类别、坐标等),但如何高效处理这些数据并将其导入数据库进行分析是开发者面临的挑战…

linux LAMP 3

[rootcode apache2]# bin/apachectl AH00558: httpd: Could not reliably determine the server’s fully qualified domain name, using fe80::20c:29ff:fe2a:708a. Set the ‘ServerName’ directive globally to suppress this message root192.168.235.5s password:┌─…

UI自动化-Selenium WebDriver

前言 Selenium WebDriver 是 Selenium 项目中最核心、最强大的组件,它是一个用于自动化控制网页浏览器的开源 API(应用程序编程接口)。 简单来说,Selenium WebDriver 就是一个允许你用编程语言(如 Java、Python、C#、…

具身多模态大模型在感知与交互方面的综述

引言在本学期方老师的《机器人与大模型》课上,我首次接触到了关于具身智能的前沿知识,尤其作为课上交互组的成员,从表情识别到语音交互到机械狗的开发实践进行了一些有意思的探索,使我在其中感受到了具身智能的巨大魅力和无限潜力…

UI 设计|审美积累 | 拟物化风格(Skeuomorphism)

拟物化是指把现实世界的材质、光影和结构带到数字界面中。木纹、金属、皮革、纸张等真实物体的质感,被细致地还原到屏幕上,让用户一眼就明白元素的意义与操作方式。它曾是iOS6之前移动端设计的主流风格,也一度被极简风格取代,但在…

EventBridge精准之道:CloudTrail事件 vs. 服务原生事件,我该如何选?

当我们深入使用AWS EventBridge时,常常会发现一个有趣的现象:对于同一个操作(比如启动一个EC2实例),EventBridge中似乎会出现两种事件。一种来自CloudTrail,记录了API调用的行为;另一种则直接来…

【算法】动态规划 斐波那契类型: 740. 删除并获得点数

740. 删除并获得点数 中等 题目 给你一个整数数组 nums ,你可以对它进行一些操作。 每次操作中,选择任意一个 nums[i] ,删除它并获得 nums[i] 的点数。之后,你必须删除 所有 等于 nums[i] - 1 和 nums[i] 1 的元素。 开始你…

AWS MySQL 读写分离配置指南

# AWS JDBC Wrapper读写分离配置实战:Spring Boot MyBatis Plus完整解决方案 ## 前言 在微服务架构中,数据库读写分离是提升系统性能的重要手段。本文将详细介绍如何在Spring Boot项目中使用AWS JDBC Wrapper实现自动读写分离,重点解决MyBat…

opencv检测运动物体

检测到的所有移动物体中轮廓中找到面积最大的轮廓&#xff0c;并绘制这个轮廓的矩形框。 #include <opencv2/opencv.hpp> #include <iostream>int main() {// 打开视频文件或摄像头cv::VideoCapture capture;capture.open("move3.mp4"); // 打开视频文件…

Camera相机人脸识别系列专题分析之十五:人脸特征检测FFD算法之libcvface_api.so算法API详细注释解析

【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了: 这一篇我们开始讲: Camera相机人脸识别系列专题分析之十五:人脸特征检测FFD算法之libcvface_api.so算法API详细注释解析 目录 一、libcvface_api.so算法API详细注释解析

图像擦除论文-2:SmartEraser、Erase Diffusion、OmniEraser

图像生成模型应用系列——图像擦除&#xff1a; 图像擦除论文-1&#xff1a;PixelHacker、PowerPanint等 图像擦除论文-2&#xff1a;擦除类型数据集构建(1) Erase Diffusion Erase Diffusion: Empowering Object Removal Through Calibrating Diffusion Pathways https://git…