腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用bash读取
pdf
内容
是否可以使用bash命令读取
pdf
的第一页(并执行一个琐碎的grep等)并相应地重命名文件?-a
浏览 2
提问于2014-07-08
得票数 1
回答已采纳
2
回答
从.
PDF
文件中
提取
数据
我需要从.
PDF
文件中
提取
数据
并将其加载到SQL2008中。谁能告诉我该怎么做??
浏览 5
提问于2011-02-07
得票数 3
2
回答
我试着一个一个地读
pdf
,然后把它转换成
数据
格式
、
、
、
、
我使用Pymupdf模块中的“fitz”来
提取
数据
,然后用熊猫将
提取
出来的
数据
转换成
数据
。the glob generator out put to list #
提取
数据
的代码: with
浏览 5
提问于2022-01-25
得票数 0
2
回答
从
PDF
中
提取
表格的tabula vs camelot
、
、
、
我需要从
pdf
中
提取
表格,这些表格可以是任何类型的,多个标题,垂直标题,水平标题等。示例
PDF
: import tabulafor t in tab:print(t, "\n=========================\n")import camelot tables
浏览 3
提问于2020-04-23
得票数 4
回答已采纳
4
回答
使用apache camel解析
pdf
文件
、
、
、
如何使用Apache Camel读取/解析
pdf
文件。有任何特定的示例或代码片段来解析该文件吗?感谢你的帮助。 提前谢谢。
浏览 8
提问于2013-10-30
得票数 0
1
回答
PDF
文件的元
数据
在哪里?我可以在任何
PDF
文件中插入元
数据
吗?
、
、
、
、
我有它允许的正确的元
数据
。我正在寻找一个自由软件,做同样的,但
PDF
文件。
浏览 0
提问于2018-12-15
得票数 6
2
回答
pdf
2json npm包没有
提取
段落中的
数据
,有没有其他的npm?
、
、
我尝试用
pdf
2json npm软件包从
pdf
中
提取
数据
,但它没有
提取
段落中的
数据
。 我有一个
pdf
文件,其中包含表格,副词和图表在它,我想
提取
原始
数据
作为一个文本文件。是否有其他选项可以使用节点js从段落中的
pdf
中
提取
数据
。
浏览 2
提问于2022-09-19
得票数 0
1
回答
使用pytesseract读取位置不正确的内容
、
、
我正在使用pytesseract来读取与日期/时间相关的内容。当要读取的内容在同一行上时,这种方法效果很好。然而,在下面的例子中,我甚至无法使用OpenCV来识别包含信息的区域: image 有没有人能帮我找到一种像在图像上一样读取信息的方法?谢谢大家
浏览 25
提问于2019-09-10
得票数 0
1
回答
如何在Java中从
PDF
文件中
提取
表格
数据
、
、
我对从
PDF
文件中
提取
数据
有疑问。我有一个
PDF
文件,其中有多个可用的
数据
表。我想从require表内容中
提取
数据
。如何使用iText/PDFBox执行此操作?
浏览 2
提问于2018-02-13
得票数 0
1
回答
用pdfbox拆分
pdf
,但会丢失字体
、
、
、
我使用pdfbox用Java编写了一些代码,它将一个
pdf
文档分割成它的各个页面,在页面中查找一个特定的字符串,然后从这个页面上生成一个包含字符串的新
pdf
。我的问题是,当保存新页面时,我会丢失字体。我刚刚做了一个快速的word文档来测试它,默认的字体是杯状字体,所以当我运行这个程序时,我会收到一个错误框,上面写着:“无法
提取
嵌入的字体.”所以它用其他的默认字体来代替字体。我已经看到了很多示例代码,这些代码演示了在输入要放在
pdf
中的文本时如何更改字体,但是没有任何东西设置
pdf
的字体。 如果有人熟悉这样
浏览 5
提问于2011-10-03
得票数 1
回答已采纳
1
回答
使用pdftotext
提取
特定
数据
、
、
、
我正在使用pdftotext Python Library从
PDF
文档中
提取
一些
数据
。import pdftotext with open("text2.
pdf
", "rb") as f:
浏览 18
提问于2021-09-08
得票数 1
回答已采纳
5
回答
如何从
PDF
中
提取
数据
?
、
、
我的公司通过Excel从外部公司接收
数据
。我们将其导出到SQL Server中,以便对
数据
运行报告。它们现在正在转换为
PDF
格式,有没有一种方法可以可靠地将
PDF
中的
数据
导入到我们的SQL Server 2008
数据
库中? 这是否需要编写一个应用程序,或者是否有一种自动化的方式来实现这一点?
浏览 8
提问于2009-07-07
得票数 7
回答已采纳
1
回答
PDF
数据
提取
、
有没有办法获取扫描的
PDF
图像,并通过突出显示所需的字段来从图像中
提取
数据
?我们每天扫描数以千计的房地产契约的
PDF
图像,并希望能够自动化的
数据
输入过程。我们面临的问题是,没有两件事是相同的。
浏览 0
提问于2015-11-24
得票数 0
1
回答
PDF
到Excel
数据
库
、
我有一个
PDF
文档,其中的
数据
是这样的:你们可能知道,是否有可能以某种方式将该文档转换为excel
数据
库,其中每个信息都堆叠在不同的列中?
浏览 0
提问于2018-10-30
得票数 0
3
回答
从
pdf
文件中获取
数据
、
我有一张
pdf
文件中的表格。有x,y,z列。我只想要x列。有可能使用python吗?如果是,怎么做? 然后我想要画x和y。我该怎么做(使用表中的
数据
)
浏览 23
提问于2022-04-14
得票数 -1
1
回答
iText打开
PDF
,无法读取内容。
、
PdfReader reader = new PdfReader("E:\\document\\6imm5562e.
pdf
");通过访问,您可以升级到最新版本的、Mac或Linux。 有关Adobe的更多帮助,请访问。
浏览 4
提问于2019-12-23
得票数 0
1
回答
从
PDF
中
提取
部分非标准文本
、
我有这个
pdf
表
数据
,它看起来很标准,但是当我将整个文本
提取
到一个字符串对象中时,
数据
是从同一列中
提取
的,而不是逐行
提取
的。附有截图。示例
pdf
文件import sys print('Yo
浏览 2
提问于2021-11-23
得票数 0
回答已采纳
1
回答
如何丢弃
PDF
中的裁剪文本
、
我需要裁剪一个
pdf
以
提取
该
pdf
文档中的一些特定信息。有没有办法裁剪
pdf
并只保留裁剪区域内的文本,而丢弃裁剪区域外的所有其他文本? input1 = PdfFileReader, 50) page.cropBox.upperRig
浏览 0
提问于2019-04-22
得票数 1
1
回答
有没有什么方法可以用UiPath从冗长的
PDF
文件中
提取
表格?
、
、
、
我需要写一个过程,从一个有20-25页的冗长的
PDF
中
提取
几个表使用UiPath。这里我面临的问题是每月需要更改的页数。
浏览 76
提问于2021-06-30
得票数 0
1
回答
使用python自动执行文本
提取
、
、
、
我有一堆excel,
pdf
,docx格式的文档,它们都有不同的形状/布局。我想在
数据
库中自动编写这些文档。使用python最好的方式是什么?
浏览 0
提问于2020-05-04
得票数 0
点击加载更多
相关
资讯
pdf图片提取怎么操作?如何提取pdf文档中的图片?
怎么提取PDF中的图片?这些软件可以提取PDF图片
pdf文字提取,pdf中的文字如何提取出来?
怎么快速提取PDF中的图片?4大PDF图片提取方法
怎么从pdf里提取图片?怎么用pdf转换器提取pdf中图片?
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券