腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
XPDF
pdftotext
和页码处理
、
、
使用
perl利用
pdftotext
从pdf中
提取
文本。效果很好。我的问题是,我正在阅读的pdf是多页的,我在每一页的顶部寻找
特定
行的
数据
。下面的代码将两个页面的全部内容转储到一个文件中。因为常量
数据
(在页面顶部)之后的
数据
长度不同,所以我不能准确地从第2页
提取
数据
。我如何首先
使用
pdftotext
或其他实用程序/模块遍历每个页面,然后在每个页面上分别调用
pdftotext
浏览 6
提问于2012-10-09
得票数 0
回答已采纳
1
回答
使用
pdftotext
提取
特定
数据
、
、
、
我正在
使用
pdftotext
Python Library从PDF文档中
提取
一些
数据
。import
pdftotext
with open("text2.pdf", "rb") as f: # Read all the text into on
浏览 18
提问于2021-09-08
得票数 1
回答已采纳
1
回答
如何判断
特定
字体是否包含PDF::API2中的
特定
字符
、
、
、
、
我在Perl应用程序中
使用
PDF::API2将OCR输出嵌入到相应的图像后面,这样就可以搜索得到的PDF,因为可以用
pdftotext
提取
OCR输出。如何判断
特定
字体是否包含
特定
字符(包括CMAP表,以便
使用
pdftotext
进行
提取
)?
浏览 0
提问于2012-02-21
得票数 4
1
回答
不能在windows中安装
pdftotext
、
、
我正在尝试从发票中
提取
数据
。我发现invoice2data会做这件事。我让pip安装了invoice2data。result = extract_data('sample.pdf')OSError:
pdftotext
not installed.我
使用
构建工具安装了它。它再次显示相同的错误。因此,我从下载了这些文件,并将
提取
的文件粘贴到我的anaconda/Lib/sitepackages目录中。现在,当我尝试pip insta
浏览 0
提问于2019-08-17
得票数 0
1
回答
如何
使用
pdftotext
格式化纯文本标记?
我正在
使用
pdftotext
从PDF文件中
提取
普通内容。
pdftotext
-layout -enc UTF-8 有没有其他方法可以做到这一点?
浏览 1
提问于2014-07-10
得票数 1
3
回答
在Python中阅读PDF并转换为PDF中的文本
、
我已经
使用
此代码将pdf转换为文本。input1 = '//Home//Sai Krishna Dubagunta.pdf'os.system(("
pdftotext
%s %s")
浏览 0
提问于2014-05-23
得票数 2
回答已采纳
1
回答
使用
bash读取pdf内容
是否可以
使用
bash命令读取pdf的第一页(并执行一个琐碎的grep等)并相应地重命名文件?-a
浏览 2
提问于2014-07-08
得票数 1
回答已采纳
1
回答
编辑pdf文件
、
、
、
我收到了一个pdf文件,是在Adobe中创建的。现在我不得不编辑这个pdf文件。我是用LibreOffice打开的。但是,无论是页面还是文本都没有采用正确的格式。这些文本超出了这样的页面界限:所以,当我在必要的编辑后将它保存为pdf时,我会在页面外丢失这些文本。我试图改变文本的格式,从Fromat > text >调整到等高线。请帮帮忙。
浏览 0
提问于2019-06-25
得票数 0
2
回答
如何
使用
pdftotext
从url读取pdf
、
、
、
然后,我想
使用
pdftotext
提取
文本。import
pdftotext
pdf =
pdftotext
.PDF(f) pdf =
pdftotext
.PDF(f, "secret
浏览 8
提问于2022-05-30
得票数 -1
回答已采纳
2
回答
查找-exec中的命令替换
、
、
、
、
我试图用
pdftotext
提取
一堆pdf的文本,
使用
find: find /path/to/pdfs -iname "*.pdf" -exec
pdftotext
{} ~/Desktop/texts/所以我尝试
使用
basename,但是这似乎没有被find执行。find /path/to/pdfs -iname "*.pdf" -exec
pdftotext
浏览 5
提问于2020-09-03
得票数 2
回答已采纳
2
回答
如何从PDF文件中的
特定
区域
提取
数据
、
、
、
、
参见此<?
浏览 7
提问于2022-03-09
得票数 -3
1
回答
基于列的拆分文本文件
、
、
、
因此,我试图创建一个脚本,它将
提取
发票的
特定
值并生成报告。我的问题是: 发票格式为pdf格式,跨越两列。在Linux命令中,我希望
使用
“
pdftotext
”Linux命令将其转换为多个文本文件(每个txt文件代表每个pdf页面)。我如何做这个--我认识到'
pdftotext
‘命令将页面的左边部分和页面的右边部分分割开,其中有21个空格。如何将
数据
的右侧(在连续读取至少21个空格后确定)到文件的末尾,因为该文件很大,而且文件的最后一页是我,如何在读取关键字之前删除脚本中的所有文本
浏览 1
提问于2012-04-05
得票数 0
1
回答
pdftotext
在linux和windows上有不同的版本。
、
、
、
、
我
使用
一个名为
pdftotext
的简单实用工具从pdf文件中
提取
文本。我发现它在
使用
-table选项时具有最干净和最文书的输出,但是这个命令行选项只能在该实用工具的windows版本上
使用
。**如何在-table linux中
使用
pdftotext
选项?
浏览 11
提问于2016-10-09
得票数 1
2
回答
如何在pdf文件中搜索
特定
文本?
、
什么样的工具可以用来搜索PDF文件。(例如代数)
浏览 2
提问于2011-02-16
得票数 1
回答已采纳
1
回答
特定
版本的
pdftotext
二进制(旧版本的poppler不是相同的版本)?
、
在我们的OSX系统上拥有一个二进制
pdftotext
的0.39版本(
使用
brew install poppler安装)。我们找不到其他版本的brew search poppler只有一个版本。我们正在试图找到这个
特定
版本的源代码(在linux上编译)。由于某种原因,我们只在这个版本(而不是更新的)上
使用
特定
的pdf文件。谢谢,如果有人有牛本的话,谢谢 /usr/local/bin/
浏览 13
提问于2016-09-05
得票数 1
1
回答
将PDF列转换为rails中的文本
、
、
、
我正在尝试从一个字典pdf中
提取
文本,其中布局有像这个这样的2列(srry,我有pdf文件,而不是url),我试着
使用
pdf-reader,但文本很混乱,因为它与列文本流相反,它只是忽略并继续读取这一行我可以尝试一页一页地
提取
文本,但是有太多的页面lol。我试图通过一个随机网站将pdf转换成html,但没有看到更容易
提取
文本soo。我已经看到了一些教程的用户接收器,但看上去不像它也会起作用。
浏览 3
提问于2020-07-02
得票数 0
回答已采纳
1
回答
是否有可根据搜索标准查找、
提取
、选择和汇总注释/注释的PDF软件?
、
、
、
详细信息:这里有两个操作: 1)查找/
提取
注释/注释;2)然后选择找到的注释/注释,并将它们汇总到一个pdf文件中。下面的问题是:是否有一个PDF软件能够根据搜索条件(例如,项目名称)查找、
提取
、选择和汇总注释/注释?📷 如您所见,我
使用
的是XChange编辑器。所以,就像我说的,XChange编辑器走了一半。在左边,我们看到突出显示的黄色文本与弹出消息打开。Search执
浏览 0
提问于2017-06-27
得票数 3
回答已采纳
1
回答
在多个pdf文件中搜索关键字
、
、
我想
使用
pdftotext
命令在多个pdf文件中搜索
特定
的关键字。通常,我们可以
使用
以下命令在单个pdf文件中搜索:但是,如果我们想在多个pdf文件中搜索,我们必须做什么呢?
浏览 0
提问于2015-09-10
得票数 2
回答已采纳
1
回答
使用
pdfcreator处理pdf或其他图像的
数据
、
、
、
、
我正在
使用
pdfcreator作为虚拟打印机,将一些图像打印到文件中。可以是pdf,可以是任何类型的图像。但我需要从中
提取
数据
。这是可以做到的吗?我正在
使用
C#。
浏览 2
提问于2010-09-08
得票数 0
1
回答
使用
Node.JS派生为多个文件生成bash
、
、
我正在Node.JS中创建一个程序,通过为每个文件创建child_process.spawn来
使用
命令行实用工具
pdftotext
提取
pdf文本。我想知道这个过程是否CPU太重,是否有成千上万的人可以
使用
而不中断任何东西。谢谢。
浏览 3
提问于2016-05-30
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券