PyPDF2 Python库的.getNumPages()方法返回pdf中的总页数为0 - 腾讯云开发者社区

文章/答案/技术大牛

发布

在python中有多个对应的库可以操作Pdf文件，其中最常用的是Pypdf2

在python中有多个对应的库可以操作Pdf文件，其中最常用的是Pypdf2PyPDF是一个操作pdf的模块，现在最常用的版本是PyPDF2;需要注意的是，这个库不能操作pdf获取文字信息PyPDF2介绍...PyPDF2 是一个纯 Python PDF 库，可以读取文档信息（标题，作者等）、写入、分割、合并PDF文档，它还可以对pdf文档进行添加水印、加密解密等操作。...对象，传入文件路径infomation = pdf.getDocumentInfo() #获取文档信息number_of_pages = pdf.getNumPages() #获取总页数完整实例代码如下...= pdf.getNumPages() #获取总页数txt = f'''{input_path} information:Author : {infomation.author},Creator :...该页面通常是从一个PdfFileReader实例中获取的pdfWriter.addPage(pdfReader.getPage(0))# insertBlankPage 将空白页插入此 PDF 文件并返回此页面的

1.1K1 0

Python操作PDF全总结|处理PDF文档不得不知道的两个库

Python在自动化办公方面有很多实用的第三方库，可以很方便的处理word、excel、ppt、pdf文件，今天我们就学习一下Python处理PDF文档的两个常用库「pdfplumber」、「pypdf2...学习文档：https://github.com/jsvine/pdfplumber 「pypdf2：」 PyPDF2 是一个纯 Python PDF 库，可以读取文档信息（标题，作者等）、写入、分割、合并...「PdfFileReader 对象的属性和方法」 ? 「PdfFileWriter 对象的属性和方法」 ?...编码规范中文版.pdf") # getNumPages() 获取总页数 for page in range(file_reader.getNumPages()): # 实例化对象 file_writer...("D:\\pdffiles\\水印.pdf") mark_page = sy.getPage(0) # 水印所在的页数 # 读取添加水印的文件 file_reader = PdfFileReader(

4K2 0

您找到你想要的搜索结果了吗？

是的

没有找到

Python 深入浅出 – PyPDF2 处理 PDF 文件

大家好，又见面了，我是你们的朋友全栈君。实际应用中，可能会涉及处理 pdf 文件，PyPDF2 就是这样一个库，使用它可以轻松的处理 pdf 文件，它提供了读，割，合并，文件转换等多种操作。...(bool)：确定是否 warnings.py 用自定义实现覆盖 Python 模块（默认为 True） PdfFileReader 对象的属性和方法属性和方法描述 getDestinationPageNumber...tree = None,retval= None) 检索文档中的指定目标 getNumPages() 计算此 PDF 文件中的页数 getOutlines(node = None,outline = None...(pageNumber) 从这个 PDF 文件中检索一个编号的页面 insertBlankPage(width=None,height=None,index=0) 插入一个空白页面到这个 PDF 文件并返回它...PageObject 对象的属性和方法属性或方法描述 static createBlankPage(pdf=None,width=None,height=None) 返回一个新的空白页面 extractText

2K3 0

PyPDF2 | 利用 Python 实现 PDF 分割

图1 分割前的 PDF 在百度了一番后，发现大多都是使用 Adobe Acrobat 软件进行剪裁，这完全不 Pythonic，因此又找了用 Python 处理 PDF 文件的方法，最后发现了 PyPDF2...这个库，本文将利用这个库，实现对 PDF 的分割。...首先，你需要通过 pip 安装这个库： pip install PyPDF2 实现切割 PDF 的思想很简单，只要我们能测量出 PDF 的长宽，接着分别将左右裁剪拼接即可，而 PyPDF2 已经提供了这些功能...计算 pdf 的总页数 page_count = pdf_input_left.getNumPages() # 5....循环所有的页数后，将文件输出为 pdf 文件 pdf_output.write(open('xxx,pdf', 'wb')) 需要注意的是，PyPDF2 默认将较短的边作为 X 轴，较长的边作为 Y 轴

2.6K2 0

Py 自动化办公

的公司赞助 PyPdf 的一个分支后来命名为 PyPDF2，两个版本功能都基本一样，最大区别就是 PyPDF2 中加入了支持 Python3 特性； PyPDF2 近期也没有再更新了，最近一个版本发布在...与其它Python 库一样，安装可通过 pip 或 conda 工具 pip install pypdf2 PDF 信息提取使用 PyPDF2 可以从 PDF 中提取到一些元数据和文本信息，对 PDF...的实例，该实例中存储着我们需要的信息；对 reader 对象调用 getNumPages 方法也可以返回文档页数；个人看法，这里面的数据也就页数有点价值，当批量统计时该方法很适用 PDF 页面旋转...PyPDF2 中 pdf 每一页都是以 page 对象存在，返回某一页的实例可通过 reader 对象中的 get_Page(page_index) 方法，其中 page_index 表示索引对某一页旋转...PDF 添加水印在今天列举的这么多功能中，我想这个功能是最有用，批量添加水印主要用到 page 对象中的 margePage() 方法，通过将两个页面合并来达到添加水印的效果因为 PyPDF2 只能操作

1.8K0 0

python pypdf2

(bool)：确定是否 warnings.py 用自定义实现覆盖 Python 模块（默认为 True） ---- PdfFileReader 对象的属性和方法属性和方法描述 getDestinationPageNumber...(tree = None,retval= None) 检索文档中的指定目标 getNumPages() 计算此 PDF 文件中的页数 getOutlines(node = None,outline...(0, 2): # 返回指定页编号的 pageObject pageObj = pdfFileReader.getPage(index) print('index = %d , pageObj =...() 页数 getPage(pageNumber) 从这个 PDF 文件中检索一个编号的页面 insertBlankPage(width=None,height=None,index=0) 插入一个空白页面到这个...PDF 文件并返回它，如果没有指定页面大小，就使用最后一页的大小 insertPage(page,index=0) 在这个 PDF 文件中插入一个页面，该页面通常从 PdfFileReader

6613 0

Python办公自动化｜批量合并PDF，拿来就用

首先导入需要的库和路径设置 import os from PyPDF2 import PdfFileReader, PdfFileWriter if __name__ == '__main__':...' # 目标文件的名字 file_name = "中华眼科学（第3版）合并版.pdf" 接着获取所有pdf文件的绝对路径，这里需要利用os库中的os.walk遍历文件和os.path.join...(pdf_file, "rb")) # 获得源PDF文件中页面总数 pageCount = input.getNumPages() outputPages...(pageCount): output.addPage(input.getPage(iPage)) print("\n合并后的总页数:%d" % outputPages)...output.addPage(input.getPage(iPage)) print("\n合并后的总页数:%d" % outputPages) # 写入到目标PDF文件 print

1.7K3 0

PyPDF2模块

(bool)：确定是否 warnings.py 用自定义实现覆盖 Python 模块（默认为 True） PdfFileReader 对象的属性和方法属性和方法...： from PyPDF2 import PdfFileReader,PdfFileWriter filer=r"C:\Users\________________MRlv\Desktop\Python...从这个 PDF 文件中检索一个编号的页面 insertBlankPage(width=None,height=None,index=0) 插入一个空白页面到这个 PDF 文件并返回它，如果没有指定页面大小...()#获取文档的总页数 for index in range(0, numPages): pageObj = pdfFileReader.getPage(index)...indirectRef：将源对象的原始间接引用存储在其源 PDF 中 PageObject 对象的属性和方法属性或方法描述 static createBlankPage(pdf=None,width

8441 0

用Python玩转PDF的各种骚操作

尽管PDF最初是由Adobe发明的，但它现在是由国际标准化组织（ISO）维护的开放标准。你可以通过使用PyPDF2包在Python中处理已先存在的PDF。...本文将带你了解如何执行以下操作：从Python中提取PDF中的文档信息旋转页面合并PDF 拆分PDF 添加水印加密PDF pyPdf，PyPDF2和PyPDF4的历史最初的pyPdf...我们还可以在reader对象上调用.getNumPages()，让它返回文档中的页数。 information这个变量具有多个实例属性，可以使用这些属性从文档中获取所需的其余元数据。...接下来，可以使用.get page()获取所需的页面。上面开始输入了第0页，也就是第一页，调用page对象的.rotateClockwise()顺时针旋转方法并输入90。...我们可以使用Python和PyPDF2为文档添加水印，而且是拥有仅包含水印图像或文本的PDF。

2.3K5 0

用Python处理PDF

Python处理PDF格式数据的笔记。...查了下相关资料，Python操作PDF的库有（只是应用的话肯定不至于造轮子从二进制数据开始读）：pdfminer、pdfminer3k、PyPDF、PyPDF2、pdf2htmlex、pdf2image...可用的pdf库用pdf2合并和切分PDF 比较几个库之后打算先从PyPDF2快速实现一些功能。...其官方文档为PyPDF2 Documentation[1]，根据文档，PDF2库包含了 PdfFileReader PdfFileMerger PageObject PdfFileWriter 四个常用的主要的调用类...=in_pdf.getNumPages() #输入pdf的页数 for pc in range(page_count): out_pdf.addPage(in_pdf.getPage

1.8K6 0

如何使用Python玩转PDF各种骚操作？

2.2K2 0

【Python】给PDF添加水印

, strict=False) # 获取PDF文件的页数 pageNum = pdf_input.getNumPages() # 读入水印pdf文件 pdf_watermark...= PdfFileReader(input_stream, strict=False) # 获取PDF文件的页数 pageNum = pdf_input.getNumPages()...PDF文件合并实现添加水印；第一种方法的水印文件是通过 word 另存为 PDF，第二种方法是自动创建一个 PDF 文件；第二种方法与第一种相比，水印的字体不能随意改变，不支持中文，省去了方法一中手动生成...PDF 水印的步骤；第一种方法可以任意修改水印的位置和字体。...参考文献 [1]：python pdf加水印 [2]：Python中通过PyPDF2实现PDF添加水印

1.5K4 0

【Python】给PDF添加水印

(30) # 指定填充颜色 c.setFillColorRGB(0, 0, 0, 0.1) # 设置透明度,1为不透明 # c.setFillAlpha(0.1)...= PdfFileReader(input_stream, strict=False) # 获取PDF文件的页数 pageNum = pdf_input.getNumPages()...PDF文件合并实现添加水印；第一种方法的水印文件是通过 word 另存为 PDF，第二种方法是自动创建一个 PDF 文件；第二种方法与第一种相比，水印的字体不能随意改变，不支持中文，省去了方法一中手动生成...PDF 水印的步骤；第一种方法可以任意修改水印的位置和字体。...参考文献 1：python pdf加水印 2：Python中通过PyPDF2实现PDF添加水印本次的分享就到这里 *** [11] 好书不厌百回读，熟读自知其中意。

6.1K2 1

PyPDF2读取中文_pdfplumber、pypdf2 常用方法总结

大家好，又见面了，我是你们的朋友全栈君。这两天学习了一些处理 PDF 文档的方法，网上查找资料的过程中发现很多处理 PDF 文件的库，多方尝试后推荐两个比较好用的。...其返回值为一个 DocumentInformation 类型，直接输出的话会得到类似下面的信息： '/Author': getNumPages()：这个获取 pdf 文件中的页数。...getPage(pageNumber)：会得到 pdf 文件中对应的 pageNumber 页数的页面对象，返回值为 PageObject 实例。...如果文件本身加密，即使在使用解密 decrypt 方法之后，还是会返回 true。 numPages：pdf 总共的页数，相当于访问 getNumPages() 的只读属性。...insertPage(page, index=0)：将 page 添加到 pdf 中，index 指定的是被插入的位置。

2.1K3 0

如何使用Python玩转PDF各种骚操作？

1.3K2 0

如何使用Python玩转PDF各种骚操作？

1.3K3 0

Python：检验pdf文件是否有效

1、基本原理利用PyPDF2的PdfFileReader模块打开pdf文件，如果不抛异常，就认为此pdf文件有效。...这种情况pdf多半也是坏的，可进一步通过页数判断。但walker在测试中发现，对于正常pdf文件，进一步通过页数判断时有时会抛出异常。...2、pdf文件在本地磁盘上 import traceback from PyPDF2 import PdfFileReader # 参数为pdf文件全路径名 def isValidPDF_pathfile...是来自网络的bytes数据由于PdfFileReader的参数为文件名或文件对象，所以需要做一下转换方法一 import traceback, tempfile from PyPDF2 import...import io, traceback from PyPDF2 import PdfFileReader # 参数为bytes类型数据。

2.4K2 0

MyBatis-plus中的Page出现返回total总为0的问题

在使用MyBatis-plus进行分页的过程中，发现返回的Page中的属性total总为0的问题，但是是有数据的！...PaginationInterceptor(); page.setDialectType("mysql"); return page; } } 2.去掉pom.xml中的

9.1K1 0

Python玩转PDF各种骚操作大全！

尽管PDF最初是由Adobe发明的，但它现在是由国际标准化组织（ISO）维护的开放标准。你可以通过使用PyPDF2包在Python中处理已先存在的PDF。...本文将带你了解如何执行以下操作：从Python中提取PDF中的文档信息旋转页面合并PDF 拆分PDF 添加水印加密PDF pyPdf，PyPDF2和PyPDF4的历史最初的pyPdf软件包于2005...我们还可以在reader对象上调用.getNumPages()，让它返回文档中的页数。 information这个变量具有多个实例属性，可以使用这些属性从文档中获取所需的其余元数据。...接下来，可以使用.get page()获取所需的页面。上面开始输入了第0页，也就是第一页，调用page对象的.rotateClockwise()顺时针旋转方法并输入90。...我们可以使用Python和PyPDF2为文档添加水印，而且是拥有仅包含水印图像或文本的PDF。

1.7K4 0

借助 PyPDF2 库把数据分析系列教程文章制作成了PDF电子书，欢迎来领取！

PyPDF2 库，顾名思义，就是用来操作PDF文件的，相信网上已经有太多相关的介绍文章了，我这里就不再赘述了。这里只重点一下制作书签的过程，网上好像还没有比较详细实用的文章！...这样就可以方便的把当前目录下的所有PDF文件都合并到一个新的PDF当中，但是却有一个问题，就是没有书签，这对于一个教程类的文档来说，是及其不友好的，下面就来看看如何添加书签根据 PyPDF2 的官方文档或网上的文章可以知道...，对于 pagenum 参数，是用来指定书签页数的，要注意，PyPDF2 中PDF的页面是从0开始的，即在序列0添加书签时会跳到首页，在n处添加书签时会跳转至n+1页。...('bookmark.pdf', 'wb')) 该函数接收两个参数，一个列表参数 pdfmark，是一个二维列表，存储着书签的名称和所在页数，另一个参数则是当前需要编辑的已经存在的PDF文件下面开始改写...，分别是数据分析入门和Python Web 入门，Python Web 入门更新的慢一些，还在难产中。。。

5301 0

点击加载更多

在python中有多个对应的库可以操作Pdf文件，其中最常用的是Pypdf2

Python操作PDF全总结|处理PDF文档不得不知道的两个库

Python 深入浅出 – PyPDF2 处理 PDF 文件

PyPDF2 | 利用 Python 实现 PDF 分割

Py 自动化办公

python pypdf2

Python办公自动化｜批量合并PDF，拿来就用

PyPDF2模块

用Python玩转PDF的各种骚操作

用Python处理PDF

如何使用Python玩转PDF各种骚操作？

【Python】给PDF添加水印

【Python】给PDF添加水印

PyPDF2读取中文_pdfplumber、pypdf2 常用方法总结

如何使用Python玩转PDF各种骚操作？

如何使用Python玩转PDF各种骚操作？

Python：检验pdf文件是否有效

MyBatis-plus中的Page出现返回total总为0的问题

Python玩转PDF各种骚操作大全！

借助 PyPDF2 库把数据分析系列教程文章制作成了PDF电子书，欢迎来领取！

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐