首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python - PyPdf2合并不能保持PDF大小

是指使用PyPdf2库进行PDF文件合并时,合并后的PDF文件大小会发生变化,无法保持原始PDF文件的大小。

PyPdf2是一个用于处理PDF文件的Python库,可以实现PDF文件的合并、拆分、提取文本等操作。然而,由于PDF文件的内部结构复杂,合并多个PDF文件时可能会导致文件大小的变化。

要解决这个问题,可以尝试以下方法:

  1. 压缩合并后的PDF文件:使用PyPdf2合并PDF文件后,可以使用其他工具对合并后的PDF文件进行压缩,以减小文件大小。常用的压缩工具有Ghostscript、Adobe Acrobat等。
  2. 使用其他PDF处理库:除了PyPdf2,还有其他一些Python库可以用于处理PDF文件,例如PyPDF4、PDFMiner、ReportLab等。尝试使用其他库进行PDF文件合并,可能会得到更好的结果。
  3. 调整合并前的PDF文件:在进行PDF文件合并之前,可以尝试对待合并的PDF文件进行预处理,例如调整分辨率、压缩图片等,以减小文件大小。可以使用Pillow、img2pdf等库进行图像处理。
  4. 分析合并后的PDF文件结构:使用PyPdf2提供的功能,可以分析合并后的PDF文件的结构,查看是否存在冗余的内容或无效的对象,进一步优化文件大小。

总结起来,PyPdf2合并PDF文件后无法保持原始文件大小,可以尝试使用其他工具进行压缩,或者尝试其他PDF处理库进行合并,同时对合并前的PDF文件进行预处理,以及分析合并后的PDF文件结构,优化文件大小。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

PyPDF2 | 利用 Python 实现 PDF 分割

图1 分割前的 PDF 在百度了一番后,发现大多都是使用 Adobe Acrobat 软件进行剪裁,这完全不 Pythonic,因此又找了用 Python 处理 PDF 文件的方法,最后发现了 PyPDF2...首先,你需要通过 pip 安装这个库: pip install PyPDF2 实现切割 PDF 的思想很简单,只要我们能测量出 PDF 的长宽,接着分别将左右裁剪拼接即可,而 PyPDF2 已经提供了这些功能...: # PdfFileReader 模块用于读取 pdf # PdfFileWriter 模块用于创建要保存的 pdf from PyPDF2 import PdfFileReader, PdfFileWriter...循环所有的页数后,将文件输出为 pdf 文件 pdf_output.write(open('xxx,pdf', 'wb')) 需要注意的是,PyPDF2 默认将较短的边作为 X 轴,较长的边作为 Y 轴...,对应的坐标如下: 图2 纵向比例下的 PyPDF2 坐标 然而我们的 PDF 是横向比例的,如下图所示: 图3 横向比例 PDF 示例 相当于: 图4 横向比例下的 PyPDF2

2.2K20
  • Python PyPDF2、pdfplumber 提取 PDF 文本、图片内容

    Python PyPDF2、pdfplumber 提取 PDF 文本、图片内容 安装库 安装 pdfplumber 安装 PyPDF2 内容提取代码 图片提取 文本提取 完整代码 说明 本方法提取的图片并不算完整...,我测试用的是阿里2017年双十一的一份PDF,AliDouble11.pdf,提取过程中有一处报错,部分图片提取不完整 由于PyPDF2 直接提取文本内容对中文支持不友好,因此结合两个库提取 安装库...github.com/mstamy2/PyPDF2 下载完成后解压,进入解压的目录 E:\tools\PyPDF2-master 执行 setup.py 进行安装 python setup.py install...PyPDF2 打开 PDF 用于提取图片 pdf_image_reader = PyPDF2.PdfFileReader(open(pdf_path, "rb")) print...PyPDF2 打开 PDF 用于提取图片 pdf_image_reader = PyPDF2.PdfFileReader(open(pdf_path, "rb")) print

    2.8K20

    python实现pdf文档合并

    目录: 使用PyPDF2库 获取要合并pdf文件的文件列表 使用PyPDF2合并pdf文档 一番今日 之前一番在免费知识星球给大家开发过一个在windows下使用的简单的pdf合并工具。...其实用python去实现真的很简单,用了tkinter + PyPDF2 + pyinstaller。 今天一番来解读下这个小工具怎么用python实现pdf文档合并的,而且合并完后还自带目录。 ?...使用PyPDF2python里最大的好处就是封装了各种强大的轮子。同样,操作pdf也有强大的库,就是PyPDF2库。这里我们就是用的PyPDF2来实现读取pdf,然后合并pdf的。...这样便获取到了所有要合并pdf文件的列表了。...使用PyPDF2合并pdf文档 def MergePDF(filepath, fileNameList, outfile): mergedDir = filepath + '/merged/'

    1.2K20

    Python 深入浅出 – PyPDF2 处理 PDF 文件

    实际应用中,可能会涉及处理 pdf 文件,PyPDF2 就是这样一个库,使用它可以轻松的处理 pdf 文件,它提供了读,割,合并,文件转换等多种操作。...文档地址:http://pythonhosted.org/PyPDF2/ PyPDF2 安装 PyCharm 安装:File -> Default Settings -> Project Interpreter...也导致一些可纠正的问题是致命的,默认是 True warndest : 记录警告的目标(默认是 sys.stderr) overwriteWarnings(bool):确定是否 warnings.py 用自定义实现覆盖 Python...(width=None,height=None,index=0) 插入一个空白页面到这个 PDF 文件并返回它,如果没有指定页面大小,就使用最后一页的大小 insertPage(page,index=0...def mergePdf(inFileList, outFile): ''' 合并文档 :param inFileList: 要合并的文档的 list :param outFile: 合并后的输出文件

    1.7K30

    使用python合并多个pdf文件

    今天需要整理一份资料,需要把多个pdf合并为一个,wps这些软件自然是有这个功能,但一般都是收费的,百度上也有很多网站,但资料上传到别人的网站,始终觉得还是不太可靠,故自己搜索了一下使用python来处理...pdf文件,故此分享这个方法 python处理pdf需要用到一个PyPDF2的库,故首先安装这个第三方库 安装这些第三方库推荐使用国内的源,比如清华、豆瓣、百度、华为等 pip install PyPDF2...-i https://pypi.tuna.tsinghua.edu.cn/simple 然后根据这个库处理pdf import os from PyPDF2 import PdfFileMerger...() for pdf in pdf_lst: file_merger.append(pdf,import_bookmarks=False) # 合并pdf文件 file_merger.write...(r"合并文件.pdf") 注意一下: 合并的时候,pdf_lst 是根据文件的名称来排序生成,如果对于pdf文件合成顺序有要求,建议吧文件按照期望的合成顺序编号1 2 3这样,方便一些 比如像下面这种

    2.1K10

    Python利用PyPDF2库获取PDF文件总页码实例

    Python中可以利用PyPDF2库来获取该pdf文件的总页码,可以根据下面的方法一步步进行下去: 1、首先,要安装PyPDF2库,利用以下命令即可: pip install PyPDF2 2、接着...补充知识:使用python合并pdf文件带书签 1、需求: 将几本纸质书进行了扫描,可是扫描的每页生成一个pdf文件。需要怎么才能把这些pdf文件合成一个呢?...网上找了下python合并pdf的脚本,发现也没有添加书签的功能的,有添加书签的也不是很灵活。 所有对网上找的一个python程序进行了升级,可以实现合并pdf并每个章节加入书签。...2、程序代码 代码运行环境:python3 需要安装PyPDF2包:pip install PyPDF2 #!...以上这篇Python利用PyPDF2库获取PDF文件总页码实例就是小编分享给大家的全部内容了,希望能给大家一个参考。

    1.9K10

    使用Python合并任意多个PDF文件

    在工作中,经常会遇到合并pdf文件的需求,这时候你会发现不是一件很容易完成的任务。包括WPS、福昕阅读器在内的很多软件都有合并pdf文件的功能,但是只有交钱变成会员之后才能使用,否则只能合并3页。...有不少网站提供了在线合并pdf文件的功能,但也是必须交钱才能用。还有的显示合并成功,但就是无法下载。如果你会一点Python,就会发现这是一件很容易的事,并且不用花一分钱。...功能描述: 使用Python合并任意多个PDF文件。 详细步骤: 1、安装扩展库PyPDF2。 ? 2、编写代码。 ?...3、把代码中pdf_files的内容改成自己要合并pdf文件名,运行代码,一眨眼,合并完成。

    4.4K20

    Python使用PyPDF2库进行PDF文件操作的详细教程

    引言在Python中,PyPDF2是一个强大的库,用于处理PDF文件。无论是合并多个PDF文件、拆分PDF文件、提取文本或者旋转页面,PyPDF2都提供了简单而灵活的解决方案。...本教程将介绍PyPDF2库的基本概念和用法,帮助你更好地理解如何在Python中进行PDF文件的各种操作。第一部分:安装PyPDF2库首先,我们需要安装PyPDF2库。...可以使用以下命令在你的Python环境中安装它:bashCopy codepip install PyPDF2确保你的Python环境已经配置好,并且可以成功安装PyPDF2库。...第二部分:合并PDF文件在这一部分,我们将学习如何使用PyPDF2合并多个PDF文件。...PyPDF2,你可以轻松地对PDF文件进行加密和解密。

    3.3K31

    Python玩转PDF的各种骚操作

    PyPDF2是一个纯Python包,可用于许多不同类型的PDF操作。...本文将带你了解如何执行以下操作: 从Python中提取PDF中的文档信息  旋转页面  合并PDF  拆分PDF  添加水印  加密PDF pyPdf,PyPDF2和PyPDF4的历史 最初的pyPdf...Python 3的原始pyPdf有一个不同的Python 3分支,但是这个分支已经多年没有维护了。 虽然最近放弃了PyPDF2,但新的PyPDF4与PyPDF2没有完全的向后兼容性。...本文中的大多数示例都可以与PyPDF4完美配合,但也有一些不能,这就是为什么PyPDF4在本文中没有更多的特色。随意用PyPDF4替换PyPDF2的导入,看看它是如何工作的。...结论 PyPDF2包非常有用,可以使用PyPDF2自动执行脚本完成PDF文档的批量操作。本文介绍了如何从PDF中提取元数据,旋转页面,合并和拆分PDF,添加水印,以及添加加密的操作。

    2.1K50

    使用Python拆分和合并PDF文件

    因此,我需要一种分割PDF文件的方法。虽然Adobe Acrobat Pro DC允许拆分和合并PDF文件,但需要付费。 Python就能够实现,谁不喜欢免费的解决方案呢?...getPage()方法允许我们将PDF文件拆分为单独的页面,以便我们可以选择,然后使用Python将它们合并到一个文件中。...pages = [i-1 for i in pages] 图3:Python列表解析 现在我们有了正确的页面索引,就可以完成PDF合并过程。...如果想合并多个PDF文件呢? 过程和上文讲述的是一样的,所以不会在这里重复。提示: 1.循环遍历要合并PDF文件。...将上述代码放到一起 下面是允许你使用Python拆分和合并PDF文件的完整代码: from PyPDF4 import PdfFileReader,PdfFileWriter pdf =PdfFileReader

    2.6K10

    如何使用Python玩转PDF各种骚操作?

    PyPDF2是一个纯Python包,可用于许多不同类型的PDF操作。...本文将带你了解如何执行以下操作: 从Python中提取PDF中的文档信息 旋转页面 合并PDF 拆分PDF 添加水印 加密PDF pyPdf,PyPDF2和PyPDF4的历史 最初的pyPdf...Python 3的原始pyPdf有一个不同的Python 3分支,但是这个分支已经多年没有维护了。 虽然最近放弃了PyPDF2,但新的PyPDF4与PyPDF2没有完全的向后兼容性。...本文中的大多数示例都可以与PyPDF4完美配合,但也有一些不能,这就是为什么PyPDF4在本文中没有更多的特色。随意用PyPDF4替换PyPDF2的导入,看看它是如何工作的。...结论 PyPDF2包非常有用,可以使用PyPDF2自动执行脚本完成PDF文档的批量操作。本文介绍了如何从PDF中提取元数据,旋转页面,合并和拆分PDF,添加水印,以及添加加密的操作。

    2K20
    领券