腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
在Java
中
从
PDF
文件
中
提取
表格
数据
、
、
我对
从
PDF
文件
中
提取
数据
有疑问。我有一个
PDF
文件
,其中有多个可用
的
数据
表。我想从require表内容中
提取
数据
。
如何
使用iText/PDFBox执行此操作?
浏览 2
提问于2018-02-13
得票数 0
3
回答
Tabula-py用于无边框
表格
提取
、
、
有没有人可以建议我
如何
使用python/java程序
从
PDF
中
提取
表格
数据
,用于
pdf
文件
中
的
以下无边框
表格
?
浏览 3
提问于2018-07-17
得票数 2
7
回答
从
PDF
文件
中
提取
文本
、
、
我需要从
PDF
文件
中
提取
文本。该文本可能是
表格
格式,它将用于外部方和我们
的
系统之间
的
数据
自动传输。 我在这里发现了一些想法,但我认为这家伙更多
的
是在谈论一次性
的
情况,我说
的
更像是日常生活:
浏览 18
提问于2009-08-14
得票数 7
回答已采纳
3
回答
从
pdf
文件
中
获取
数据
、
我有一张
pdf
文件
中
的
表格
。有x,y,z列。我只想要x列。有可能使用python吗?如果是,怎么做? 然后我想要画x和y。我该怎么做(使用表
中
的
数据
)
浏览 23
提问于2022-04-14
得票数 -1
1
回答
如何
提取
pdf
格式
的
表列
数据
并存储在变量python
中
、
、
、
、
我有3个表(图像粘贴),所有3个表(有相同
的
列)看起来都一样,我希望在变量
中
存储3个表
的
地址列(黄色)
的
数据
。
浏览 8
提问于2022-02-16
得票数 -1
2
回答
从
PDF
中
提取
表格
的
tabula vs camelot
、
、
、
我需要从
pdf
中
提取
表格
,这些
表格
可以是任何类型
的
,多个标题,垂直标题,水平标题等。我已经实现了两个表
的
基本用例,并且发现tabula比camelot做得更好,仍然不能完美地检测所有表,而且我不确定它是否适用于所有类型
的
表。
表格
执行情况:tab = tabula.read_
pdf
('pdfs/<
浏览 3
提问于2020-04-23
得票数 4
回答已采纳
2
回答
pdf
2json npm包没有
提取
段落
中
的
数据
,有没有其他
的
npm?
、
、
我尝试用
pdf
2json npm软件包
从
pdf
中
提取
数据
,但它没有
提取
段落
中
的
数据
。 我有一个
pdf
文件
,其中包含
表格
,副词和图表在它,我想
提取
原始
数据
作为一个文本
文件
。是否有其他选项可以使用节点js
从
段落
中
的
pdf
中
提取
数据</e
浏览 2
提问于2022-09-19
得票数 0
1
回答
如何
使用aws
从
文档中
提取
服务和.net导出CSV
表格
、
、
我试图使用AWS
的
DetectDocument (异步)
从
PDF
文件
中
提取
表格
和
数据
,使用
的
是C#/.NET。我在
数据
提取
方面很成功,但我不知道
如何
使用AnalyzeDocument
提取
PDF
中
的
表格
并导出到CSV
文件
中
。 阅读亚马逊网络服务
的
文档
浏览 21
提问于2019-09-03
得票数 1
回答已采纳
3
回答
在Python中生成
PDF
文档
的
FLOSS/免费解决方案?
、
、
在没有商业/受限制
的
库
的
情况下,用Python生成嵌入字体
的
PDF
文档最简单
的
方法是什么? 我想生成包含
表格
数据
和页眉/页脚
的
文档。我尝试过reportlab,但虽然功能强大,但似乎很难使用。
浏览 1
提问于2011-01-10
得票数 3
回答已采纳
1
回答
图像保留结构
中
的
翻译语言
、
、
我们希望将
pdf
文档
中
的
图像从不同
的
语言转换为英语。它们是扫描过
的
图像,很多时候都有
表格
或一些结构。我们希望翻译成英语,但尽可能保留文档
的
结构。因此,仅仅基于纯文本
的
翻译是不够
的
。我们在安卓上看到了谷歌翻译应用程序,它似乎对phone..is上
的
照片做了类似的事情,还有一个谷歌云应用程序接口,它也做了同样
的
事情?为了在Google cloud上做到这一点,我们应该使用哪种api,您能给我们指出api
浏览 6
提问于2021-07-21
得票数 0
2
回答
如何
在itextSharp
中
检测表启动?
、
、
、
、
我正在尝试将
pdf
转换为csv
文件
。
pdf
文件
具有
表格
格式
的
数据
,第一行为标题。我已经可以
从
单元格中
提取
文本,比较
表格
中文本
的
基线,并检测换行符,但我需要比较
表格
边框来检测
表格
的
开始。我不知道
如何
检测和比较
PDF
中
的
线条。有谁可以帮我? 谢谢!
浏览 2
提问于2013-04-02
得票数 3
回答已采纳
1
回答
浏览
pdf
文件
以找到特定页面,并从python图像中
提取
表格
数据
。
、
、
、
、
我遇到了一个任务,它要求我
从
pdf
文件
中
的
图像中
提取
表格
数据
,通过python代码将格式整齐
的
数据
转换成
数据
。需要处理
的
文件
有几个,所有
文件
中
的
相关页可能有不同
的
页码,因此解决这个问题
的
步骤顺序(我
的
假设)是: 浏览
pdf
的</
浏览 3
提问于2021-12-15
得票数 -1
1
回答
PDF
实时下载和转换
、
、
我正在寻找一种方法,使用谷歌应用脚本下载
PDF
文件
,并转换成谷歌工作表
的
文件
。 这是因为网站只提供
PDF
格式
的
数据
,而我不能使用导入功能来获取
数据
以进行实时更新
浏览 7
提问于2021-06-10
得票数 0
2
回答
如何
确定
PDF
是否被标记?
、
我
如何
知道
PDF
是否被标记?我正在开发一个程序,可以在
PDF
文件
中
复制一个文本并在我
的
应用程序
中
显示它,所以我尝试测试这个
PDF
文件
,我从一个
PDF
文件
(普通Copy+Paste)
中
复制了一个表,并将它粘贴到MS
中
。结果是没有
表格
的
普通文本。当您
从
pdf
文件
中</em
浏览 6
提问于2012-10-04
得票数 2
回答已采纳
1
回答
PDFBox :
从
表中
提取
数据
、
、
如何
使用pdfbox
从
pdf
格式
的
表格
中
提取
数据
?在这个过程
中
,使用PDContentStream和PageStripper classes.Index可以找到文本和内容
的
索引,必须找到表
中
的
行,有人可以帮助扩展哪个类和实现哪个方法吗?我尝试了以下方法来
提取
文本
的
起始索引: public static void
浏览 0
提问于2016-06-30
得票数 3
1
回答
用python django
中
的
pdftk填充
pdf
表单
的
最佳方法是什么?
、
、
我有两种
表格
pdftk sample.
pdf
dump_d
浏览 4
提问于2012-11-29
得票数 1
1
回答
pdfplumber可以为我扫描
的
pdf
提取
表格
吗?
、
、
、
、
(我知道pdfplumber主要是针对计算机生成
的
PDF
。然而,在我花几天时间
从
扫描
的
PDF
文件
中
手动输入
数据
之前,我想我应该问问pdfplumber是否能以某种方式帮助我。)我
的
问题是:示例: 现在,我正在尝试
从
扫描
的
PDF
中
提取
表格
浏览 9
提问于2021-11-18
得票数 0
2
回答
使用Adobe API
提取
PDF
内容
、
、
我正在尝试读取
PDF
文件
的
内容,该
文件
由多个表组成。使用Java和Adobe API,如果所有单元格都有一行内容,我就能够
提取
表格
中
的
内容。当单元格有多行时,问题就出现了,这会导致
提取
的
内容移动到下一行,从而导致与表头不对齐。 有没有什么方法可以
从
PDF
中
按原样
提取
内容,同时保持
表格
格式与在
PDF
中</
浏览 56
提问于2015-02-11
得票数 2
2
回答
如何
使用camelot
从
pdf
中
提取
表格
?
、
、
、
我想在python3
中
使用camelot
从
pdf
中
提取
所有的
表格
。#
PDF
file to extract tables fromtables = camelot.read_
pdf
(file)print("Total tables ex
浏览 29
提问于2020-05-27
得票数 1
2
回答
从
truetype字体
文件
中
的
表中
提取
信息
、
、
、
在解析
pdf
文件
时,我
的
解析器遇到一个Tf运算符,该运算符
的
字体字典
中
SubType条目的值设置为TrueType。Encoding条目不存在,symblic标志已设置。我
的
问题是:
如何
将字符代码映射到没有编码
的
字符? 第5.5.5节字符编码规定,TrueType字体在字体
文件
的
表格
中表示内部
数据
。看起来这些
表格
可以帮助我映射字符代码。我做得对吗?
如何</
浏览 3
提问于2012-09-29
得票数 1
点击加载更多
相关
资讯
如何提取PDF文件中的图片内容?
如何提取pdf文件中的图片?简单的提取方法分享给你!
pdf文件中的图片怎么提取?教你快速提取PDF中的图片
如何用Python从PDF文件中提取文本词汇
【WPS神技能】如何从Excel表格中快速提取不重复数据?
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券