使用python将大型PDF文件拆分为单个PDF

文章/答案/技术大牛

发布

1回答

、、

我正在尝试将一个大的PDF文件从5000页拆分到6000页。PDF文件有7000页，包含文本和图像，大小为250MB。我所写的python代码适用于较小的PDF文件。PDF文件已写入我的输出文件夹，但已损坏且大小为0kb。增加递归限制也无济于事。我能做些什么？压缩PDF文件然后拆分？这是我的代码： pdf_file = open(path,&#

浏览 21提问于2019-04-12得票数 0

2回答

如何从pdf中提取矢量图

、、

我用这种方式将我的图形插入到我的pdf文件中:我首先使用inkscape创建了一个矢量图。然后我把它转换成pdf格式，然后用乳胶将它包含到pdf中。现在，使用这个生成的PDF，我想提取上一个svg图。我更喜欢一个将以pdf作为输入和输出svg的数字。 📷

浏览 0提问于2014-03-03得票数 7

2回答

拆分PDF的特定页面并使用Python保存

、

我试图将20页的pdf文件(单个)分成五个相应的pdf文件，第一个pdf包含1-3页，第二个pdf文件只包含第四个页面，第三个pdf包含5到10个页面，第四个pdf包含11-17个页面，而第五个pdf我需要python中的工作代码。下面提到的代码将整个pdf文件拆分为单个页面

浏览 13提问于2019-04-10得票数 0

回答已采纳

1回答

在VB.NET中按顺序打印多个PDF文件

、、、

我在使用下面的代码发送打印命令的顺序中遇到了很多PDF文件的问题： 'calls the process for theprinting of the pdf files myProcess.StartInfo.WindowStyle我想知道是否有更好的方法来打印这些文件，在那里它可以打印得更快，而且仍然是有序的。在我的脑

浏览 4提问于2012-05-16得票数 1

回答已采纳

6回答

使用PDFTK将PDF拆分成多个页面？

、、、、

我知道如何使用以下脚本使用PDFTK将大型PDF拆分为单个页面：但是现在我想将PDF除以另一页，这样每个新PDF都有两个(2)页(例如，第1+2页，第3+4页，5+ 6页等等)。

浏览 9提问于2017-05-05得票数 10

回答已采纳

4回答

PDF文本搜索和拆分库

、

我正在寻找服务器端PDF库(或命令行工具)，它可以：服务器程序将扫描PDF，查找搜索模式，保存

浏览 9提问于2010-04-21得票数 3

回答已采纳

1回答

我制作了一个从PDF中提取手写文本的Python模块。提取有时会相当慢(每个文件20-30秒)。我有大约100,000个PDF(有些有很多页)，我想在所有这些文件上运行文本提取。# Do stuff with text 我们以前使用过一次Spark (一个同事，不是我)将几百万个文件的索引从SQL DB分布到几个服务器上的Solr中，但是在研究这一点时，Spark似乎更多地是为了并行化大型数据集，而不是分配单个任务。

浏览 10提问于2018-01-08得票数 0

回答已采纳

1回答

命令行工具(S)或用于构建PDF报告的信息

、、、

我正在编写一个脚本，它以一个包含头块的PDF文件为输入，再加上一个包含黑白矢量图形的多页PDF文件再加上一个小文本，并输出另一个PDF文件，其中输出中的每个页面都由一个由六个单元格组成的标题块组成，每个单元格包含一个来自多页输入文件的一个页面的缩小副本我得到的最接近的是使用ImageMagick的“蒙太奇”命令。我遇到的问题是，ImageMagick在做任何其他事情之前都会对它的所有输入进行扫描，所以当我达到我所需要的分辨率甚至只有4到5页的输出时，它

浏览 0提问于2019-07-30得票数 1

3回答

在几张纸上将SVG转换为PDF

、、

我在Inkscape中创建了一个SVG文件。我想把它印在多张纸上，最后形成一张大海报。我需要把这些多张纸转换成PDF格式，这样我就可以从任何操作系统打印出来。我正在处理的文件：生成一个PDF与两个A3工作表(420毫米x 297毫米)。inkscape-页面向Inkscape添加了对多个页面的支持，但不支持将给定文件分离到页面。

浏览 0提问于2014-11-04得票数 11

回答已采纳

1回答

使用批处理文件将模板PDF合并为多个PDF文件的软件

、

我需要创建一个PDF空白模板发送说明与条款和条件打印在每一页的背面。我需要然后合并模板(页面前面)文件与许多个人PDF发送说明，并打印或电子邮件他们。我需要在作业调度程序中批量运行这个作业。

浏览 0提问于2018-02-15得票数 1

2回答

ABCPDF:将PDF文件拆分为单个页面PDF文件

、

我正在使用ABCpdf工具，我试图将1TB的PDF文件(所以效率是一个考虑)分成单个页面PDF文件。theSrc = new Doc();theSrc.Read(&quo

浏览 1提问于2013-08-08得票数 4

回答已采纳

3回答

iPhone -像在iBooks中一样查看PDF

、

我对在我的应用程序中显示多页PDF的视图有疑问。我找到了webview的解决方案，但它们缺乏在页面之间水平缩放和滚动的能力。我也找到了使用Quartz2D的解决方案，但问题与上面相同。有没有办法像在iBooks中那样展示PDF？你可以按-I/out缩放，在页面之间水平列出。还有如何处理单个PDF文件，而不是将PDF拆分为多个页面。非常感谢。

浏览 0提问于2010-06-23得票数 6

回答已采纳

1回答

删除因打开PDF文件而失败的目录

、、、

伙计们，我是新来的，程序说明：我目前正在开发一个python程序，它将包含PDF的文件夹解压缩到一个“临时”文件夹。然后将PDF的页面拆分为单个页面PDF，并根据页号将它们排序为另一个路径上的文件夹("/Georeferenzieren/0；/Georeferenzieren/1；.“)。问题:所有文件都工作得很好，但是当我尝试删除临时文件

浏览 4提问于2022-07-05得票数 0

回答已采纳

1回答

在Python中将Excel文件转换为横向PDF

、、

我使用此代码将Excel文件另存为PDF，但当它保存时，它会另存为多个页面，同时电子表格会被一分为二。有没有可能使用Python将方向更改为横向？def PDF(): # Open Microsoft Excel excel = win32com.client.Dispatch("Excel.Application")= excel.Workbooks.Open('Logbook

浏览 248提问于2021-11-22得票数 0

4回答

删除包含python的文件夹和子文件夹的pdf文件？

、、、

我试图删除300个pdf文件。所有的pdf文件作为不同的名称，他们都散布在一个大文件夹，分为许多子文件夹和子文件夹。我如何处理python (我使用python 2.7.8)？

浏览 4提问于2015-02-08得票数 11

回答已采纳

2回答

Python -按页划分pdf

、、、、

我使用PyPdf2将大型PDF拆分为页面。问题是这个过程非常缓慢。这是我使用的代码：from PyPDF2 import PdfFileWriter, PdfFileReader file_name = "%s/#*#*#*##-%s.pdf&quo

浏览 3提问于2016-10-04得票数 4

回答已采纳

2回答

使用Php将单个PDF拆分为子Pdf

、

我得到了一个任务，用php把一个pdf分解成多个pdf文档。到目前为止，我还没有写任何代码，因为我不确定该走哪条路。但我会尽我所能在这里解释情况。我有一个有几页的pdf文档，所有我想要的是通过传递页码将这个pdf分解成多个pdf。希望能有办法实现这一点。

浏览 6提问于2012-12-05得票数 0

2回答

为13Kpdf文档运行for循环时出现的空间错误不足

、

我正在为13Kpdf文件做循环，它读取、预处理文本、查找相似之处并在txt中写入。但是，当我运行for循环时，它会出现一个错误。我试图删除文件夹中的隐藏文件，如Thumbs.db，但同样的问题再次出现。 ## get vector with all pdf names ## for loop over all pdf d

浏览 1提问于2019-07-12得票数 6

1回答

reportlab，查找页面中最后一段的位置/坐标

、、

据我所知，reportlab是用于处理pdf的最健壮的库，但是，如果可能的话，通过另一个库就可以了。from pdfrw.toreportlab import makerloutput_file = 'def.pdf' reader = PdfReader(input

浏览 1提问于2016-08-18得票数 0

3回答

R:文本挖掘，创建每个文档的单词列表

、、、

我正在从一个目录中的多个PDF文件中读取文本。然后，我使用tidytext::unnest_tokens()-function将这些文本拆分为单个单词(标记)。有没有人可以告诉我，如何在test-tibble中添加一个额外的列，其中包含每个单词所来自的文件的名称？library(pdftools)library(tidytext) files <- list.files(pattern = "pdf</e

浏览 27提问于2021-08-05得票数 1

回答已采纳

点击加载更多