腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
pdftotext
无法
读取
某些
文档
、
、
我目前正在使用以下代码使用
pdftotext
将PDF文件
读取
到python中。import
pdftotext
pdf =
pdftotext
.PDF(f) bill
浏览 10
提问于2021-10-18
得票数 1
回答已采纳
2
回答
将PDF的内容打印到命令行
、
、
、
我正在寻找一个命令行程序,可以打印出PDF文件的文本,就像文本文件的cat。
浏览 0
提问于2011-10-11
得票数 11
回答已采纳
1
回答
在linux下编程运行
pdftotext
x.pdf y.txt?
、
、
getExtenstion(path), "pdf") == 0){ if(pid == 0) { } readTextFile(path, buffer);} 我想在c中
读取
pdf文件,但在网上搜索后,我知道直接
读取
pdf文件太难
浏览 37
提问于2019-01-13
得票数 0
回答已采纳
1
回答
在使用加载程序集(Dll)的函数时获取错误
、
它是用来
读取
PDF文件的,所以我在dll中使用"itextsharp“程序集作为参考程序集。现在使用dotnetfactory特性加载程序集,我尝试使用一个函数来
读取
pdf文件。我收到了跟随错误。外部对象
PdfToText
.PdfClass::ReadPdfFile引发了以下异常:
无法
加载文件或程序集'itextsharp、Version=5.2.0.0、Culture=neutral、PublicKeyToken其中
PdfToText
是dll中使用的命名空间名称,而PdfClass是
浏览 2
提问于2012-03-16
得票数 0
回答已采纳
1
回答
有没有办法让需要文件参数的命令行程序使用stdin?
、
、
、
、
我正在尝试使用
pdftotext
命令来处理来自stdin的数据,而不是将中间数据缓存在临时文件中。注意,
pdftotext
命令是从Java程序执行的。
pdftotext
需要一个文件参数,如果没有提供,则打印使用信息。据我所知,stdin被忽略了。 我有一个不可移植的解决方案(在linux上使用伪文件'/dev/stdin')。假设存在
pdftotext
程序,理想的解决方案将在linux和windows上运行。
浏览 2
提问于2011-05-24
得票数 3
回答已采纳
1
回答
子进程没有输出任何内容
、
、
我正在尝试使用Python来运行
pdftotext
,但是由于
某些
原因,我的代码
无法
工作。如果我运行下面的代码,我希望content变量将包含PDF的内容,但我得到的结果只是一个空字符串。def getPDFContent(path): process = subprocess.Popen(["
pdftotext
浏览 0
提问于2010-03-19
得票数 1
回答已采纳
2
回答
在repl中使用Python从PDF中提取文本
、
、
、
我正在尝试用python从PDF中
读取
数据,并且我尝试使用repl.it文件,只是因为它更容易测试不同的库。我已经尝试过PyPDF2和PyPDF4,它们都可以工作,但不提供任何空格。
pdftotext
无法
正确下载。我想知道是否有更清晰的
文档
来说明如何给我的pdfminer3留出空格,或者是否有更多的库可以尝试。
浏览 17
提问于2019-10-12
得票数 0
3
回答
检测倒过来的pdf页面
、
、
、
我们使用php、pypdfocr和
pdftotext
来进行OCR,并从已扫描或传真给我们的
文档
中提取文本。问题是,当
文档
被倒转扫描或传真时,或者
某些
页面打算被
读取
时(因此文本在页面上旋转了90度)。tessdata cp eng.traineddata osd.traineddata中 对于有90度文本的页面,产生的OCR文本层并不坏,但是,倒过来的页面,OCR会把每个单词都翻转到适当的位置,这样如果
文档
中出现了
浏览 4
提问于2015-08-05
得票数 3
回答已采纳
3
回答
当我从本地计算机切换到我的虚拟主机时,从python脚本调用
pdftotext
不起作用
、
、
、
、
我在我的本地机器上测试了它,我有python 2.6.2和
pdftotext
版本0.12.4。def ConvertPDFToText(currentPDF):tf.write(pdfData) if (len(
浏览 3
提问于2011-01-29
得票数 4
回答已采纳
1
回答
使用
pdftotext
提取特定数据
、
、
、
我正在使用
pdftotext
Python Library从PDF
文档
中提取一些数据。import
pdftotext
with open("text2.pdf", "rb") as f: # How我使用正则表达式: ^(Account\s+Number).*$ 但是
无法
弄清楚如何从整个字符串中提取数据。
浏览 18
提问于2021-09-08
得票数 1
回答已采纳
2
回答
在Windows上安装
pdftotext
(用于R,'tm‘包)
、
、
、
我有困难使用R,'tm‘包,在.pdf文件中
读取
。in readPDF(PdftotextOptions = "-layout") : 我认为这是因为
pdftotext
程序( xpdf,的一部分)没有正确安装在我的机器上,因此R
无法
访问它。正确安装xpdf/
pdftotext
的步骤是什么,以便可以执行上面的R代码?(我知道已经发布了类似的问题,但是它们不解决相同的问
浏览 3
提问于2016-03-23
得票数 1
1
回答
通过包"tm“导入R中的pdf
、
、
我知道在"R“工作区中通过包"tm”获取pdf的实际示例,但
无法
理解代码是如何工作的,因此
无法
导入所需的pdf。在以下代码中导入的pdf是"tm“vignette。代码是 pdf <- readPDF(PdftotextOptions = "-layout")(elem =minn是我试图导入的pdf
文档
。喜欢 if(file.exists(Sys.whic
浏览 1
提问于2013-07-01
得票数 0
回答已采纳
1
回答
在wordpress中有没有方法
读取
pdf或doc
文档
?
、
我想在wordpress插件中阅读pdf或doc
文档
的文本内容。我下载了xpdf,并用它来获取内容。但在wordpress插件或主题中,我
无法
获取内容。$filename = "try.pdf";$content = shell_exec('xpdf\
pdftotext
' .
浏览 9
提问于2012-05-07
得票数 0
1
回答
为什么subprocess.run不读新行,而subprocess.call却读?
、
call方法的输出是完美的--删除了所有新行,
文档
的格式完全正确,'-‘字符、符号和表处理得很完美。Subprocess.CALLSubprocess.RUN resul
浏览 0
提问于2019-01-31
得票数 2
回答已采纳
3
回答
从PDF(我有PDF的链接)中提取拼音文本
、
我有一个像这样的链接我想下载这个,并对其进行解析以获得文本内容。
浏览 0
提问于2011-02-05
得票数 10
回答已采纳
1
回答
laravel 7 pdf -text\x{e76f}
无法
读取
pdf文件
、
、
我得到了一个错误: public function
pdftotext
(Request $request) {$pdf = $request->input('file'); /&
浏览 10
提问于2021-01-14
得票数 0
3
回答
读取
pdf文件的内容
、
、
、
、
有没有命令行工具来
读取
linux.Please上的pdf文件,并指出相应的urls。 谢谢..
浏览 3
提问于2010-10-05
得票数 0
回答已采纳
1
回答
从pdf中提取文本的最好的perl模块是什么?
、
、
、
从pdf中提取文本的最好方法是什么?
浏览 2
提问于2011-01-19
得票数 6
回答已采纳
1
回答
控制来自文件夹的输出
我有数以千计的PDF
文档
,我试图梳理和提取出的只是
某些
数据。我已经成功地创建了一个脚本,该脚本遍历每个PDF,将其内容放入.txt,然后搜索最终的.txt以获取所请求的信息。Recurse -Filter *.pdf $outfile = -join ', ' }Start-Process powershell.exe -Verb R
浏览 0
提问于2021-10-31
得票数 1
回答已采纳
2
回答
从PDF中提取表格数据
、
、
到目前为止我所做的: 如果“是”,对此的任何指示都会有帮助。如果“否”,关于这一事实的明确信息也是有帮助的。
浏览 3
提问于2014-05-06
得票数 12
回答已采纳
点击加载更多
相关
资讯
ArcMap中无法读取NetCDF数据
git:无法读取远程存储库
爬虫爬取英文文档存为PDF,在读取PDF自动翻译文档
希捷Seagate移动硬盘无法读取怎么修复?
磁盘结构损坏且无法读取如何恢复
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券