首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用python合并多个pdf文件

使用python合并多个pdf文件

作者头像
用户9925864
发布于 2022-07-27 01:41:51
发布于 2022-07-27 01:41:51
2.5K00
代码可运行
举报
运行总次数:0
代码可运行

今天需要整理一份资料,需要把多个pdf合并为一个,wps这些软件自然是有这个功能,但一般都是收费的,百度上也有很多网站,但资料上传到别人的网站,始终觉得还是不太可靠,故自己搜索了一下使用python来处理pdf文件,故此分享这个方法

python处理pdf需要用到一个PyPDF2的库,故首先安装这个第三方库

安装这些第三方库推荐使用国内的源,比如清华、豆瓣、百度、华为等

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple

然后根据这个库处理pdf

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import os
from PyPDF2 import PdfFileMerger

target_path = r'pdf'  ## pdf目录文件
pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]

file_merger = PdfFileMerger()
for pdf in pdf_lst:
    file_merger.append(pdf,import_bookmarks=False)     # 合并pdf文件

file_merger.write(r"合并文件.pdf")

注意一下:

合并的时候,pdf_lst 是根据文件的名称来排序生成,如果对于pdf文件合成顺序有要求,建议吧文件按照期望的合成顺序编号1 2 3这样,方便一些

比如像下面这种

在当前目录就生成好了对应的文件

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法工程师的学习日志 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
记录python一些技巧
记录python一些技巧 1、使用if a is not b,而非if not a is b。 2、不用if len(somelist) == 0来检查空值,而用if not somelist来检查(它会假定:空值将自动评估为False)。 3、检测是否为非空值时,用if somelist会默认把非空值判断为True 4、引入模块的时候,总是应该使用绝对名称,而不应该根据当前模块的路径来使用相对名称。例如,引入bar包中的foo模块时,应该完整写出from bar import foo。如果一定要用相对名称
公众号---人生代码
2019/10/24
5350
软件测试|教你用Python处理PDF文件(一)
我们在工作中,难免会遇到需要处理PDF文件的情况,PDF文件与Word文件不同,内容提取不是很容易,表格和图片都需要特别处理。不过PDF有一个优势,PDF可以跨平台使用,Windows系统,Mac系统都可以打开PDF文件,不像doc文件,需要在word或者类似的软件中才能打开。
霍格沃兹测试开发Muller老师
2023/08/09
3500
零代码编程:用ChatGPT来批量合并多个PDF文件
一个文件夹里面有38个PDF文件,现在想合并成一个PDF文件。用ChatGPT可以非常简单的实现。
AIGC部落
2024/06/24
1640
零代码编程:用ChatGPT来批量合并多个PDF文件
python PdfFileMerger
python 3.9PyPDF2==1.26.0要件:a.pdf,b.pdf → merge.pdf导入包:from PyPDF2 import PdfFileMerger, PdfFileReader直接写入指定文件中:def merge_pdf_document(docs:List[str], file_name:str): """PDF merge args: docs : file path list e.g.['C://temp//a.pdf','C://temp
刀枪不入de王二花
2022/08/25
2840
python PdfFileMerger
Python巧妙操作PDF文档
PDF(Portable Document Format)是一个通用文件格式,几乎可以在所有操作系统和设备上阅读。PDF 文件可以包含包括文本、图片、图形、表格、链接、多媒体等各种内容,具有高度的可读性和可编辑性,适用于各种文档形式的存储和传输。PDF 文件支持加密和数字签名保护机制,确保了文件的安全性。PDF 文件可以被搜索、复制、打印,方便办公和学习使用。
double
2024/01/23
3050
Python巧妙操作PDF文档
Python办公自动化|批量合并PDF,拿来就用
大家好,今天分享一个实用的办公脚本:将多个PDF合并为一个PDF,例如我手上现在有如下3个PDF分册,需要整合成一个完整的PDF
刘早起
2020/05/12
1.7K0
PDF 合并软件要收费?程序员自己做一个
最近,鱼皮遇到点麻烦事儿,需要对 几千个 PDF 文件做统一处理,比如删除所有 PDF 的前几页、或者给所有 PDF 添加封面等。
程序员鱼皮
2021/03/20
1.2K0
markdown转为pdf文件
把.md格式转为.pdf格式,并批量处理,最后将多个pdf文件合并为一个pdf并以文件名作为书签名
hankleo
2020/09/17
1.1K0
Python操作PDF全总结|处理PDF文档不得不知道的两个库
Python在自动化办公方面有很多实用的第三方库,可以很方便的处理word、excel、ppt、pdf文件,今天我们就学习一下Python处理PDF文档的两个常用库「pdfplumber」、「pypdf2」。
吾非同
2021/01/20
3.9K0
Python: 基于指定单号批量合并PDF文件
文章背景: 在工作中,有时需要合并指定单号的PDF文件。比如需要将指定单号的测试数据合并为一份文件。
Exploring
2024/11/23
1460
Python:  基于指定单号批量合并PDF文件
Python也可以合并和拆分PDF,批量高效!
PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。
派大星的数据屋
2024/04/19
2670
Python也可以合并和拆分PDF,批量高效!
Python | PDF 提取文本的几种方法
常见的 PDF 文件可以分为两类:一种是文本转化而成(Text-Based),通常可以直接复制和粘贴;另一种是扫描文件而成(Scanned),比如影印书籍、插入图片制成的文件。依据此分类,将 Python 中处理 PDF 文件的第三方库可以简单归类:
PyStaData
2021/05/18
13.5K0
Python | PDF 提取文本的几种方法
Python办公自动化:"破解WPS会员"之文档拆分合并
看到标题是不是有点惊讶,博主怎么走上了很刑的路线?看完此篇文章,教你自己做一个无限使用永久免费的文档拆分合并小工具
小宇-xiaoyu
2025/01/14
2630
Python办公自动化:"破解WPS会员"之文档拆分合并
用Python玩转PDF | 批量合并文件
有很多工作场景,你需要把多个PDF文件合并一个。也有很多软件可以完成多个PDF文件的合并,但不够灵活。更加灵活的方式,通过Python编写程序自己实现。
TalkPython
2022/11/21
1.2K0
Python爬虫:爬取在线教程转成pdf
1、网站介绍2、准备工作2.1 软件安装2.2 库安装3、爬取内容3.1 获取教程名称3.2 获取目录及对应网址3.3 获取章节内容3.4 保存pdf3.5 合并pdf4、完整代码
王强
2018/08/09
3K0
Python爬虫:爬取在线教程转成pdf
Python实现PD文字识别、提取并写入CSV文件脚本分享
扫描件一直受大众青睐,任何纸质资料在扫描之后进行存档,想使用时手机就能打开,省心省力。但是扫描件的优点也恰恰造成了它的一个缺点,因为是通过电子设备扫描,所以出来的是图像,如果想要处理文件上的内容,直接操作是无法实现的。
老表
2022/04/07
3.5K0
Python实现PD文字识别、提取并写入CSV文件脚本分享
Python使用PyPDF2库进行PDF文件操作的详细教程
在Python中,PyPDF2是一个强大的库,用于处理PDF文件。无论是合并多个PDF文件、拆分PDF文件、提取文本或者旋转页面,PyPDF2都提供了简单而灵活的解决方案。本教程将介绍PyPDF2库的基本概念和用法,帮助你更好地理解如何在Python中进行PDF文件的各种操作。
Michel_Rolle
2024/01/25
4.6K0
python实现pdf文档合并
之前一番在免费知识星球给大家开发过一个在windows下使用的简单的pdf合并工具。其实用python去实现真的很简单,用了tkinter + PyPDF2 + pyinstaller。 今天一番来解读下这个小工具怎么用python实现pdf文档合并的,而且合并完后还自带目录。
efonfighting
2019/10/08
1.3K0
用Python处理PDF
PDF作为可移植文档格式(Portable Document Format),在日常生活中经常接触到,最近处理一些数据更是频繁接触一些需要批量处理pdf文件的需求,因此便想整理一下自己实践的用Python处理PDF格式数据的笔记。本文会保持更新。PDF处理的高频需求有:读取、写入、格式转换(pdf提取文本写入txt、根据url写入pdf等) 、批处理(多个pdf合并为1个、切分pdf)等等。查了下相关资料,Python操作PDF的库有(只是应用的话肯定不至于造轮子从二进制数据开始读):pdfminer、pdfminer3k、PyPDF、PyPDF2、pdf2htmlex、pdf2image、pdf2xlsx等。
蛰虫始航
2019/09/29
1.8K0
告别手动编辑:9个Python库让PDF操作自动化
大家好,这里是程序员晚枫,2年前发布了一个开源项目:python-office,目前在GitHub上有800+⭐,最近在开发新功能时感觉Python知识有点不够用了。
程序员晚枫
2024/05/30
1.9K0
相关推荐
记录python一些技巧
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档