腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
OCR
表格
识别
是否支持Excel
表格
合并?
浏览 244
提问于2022-06-15
4
回答
ORC
文字
识别
怎么使用下载?
点击进去简介和费用介绍,具体怎么使用操作?
浏览 580
提问于2018-04-10
1
回答
我们应该使用什么python库来从
PDF
中提取包含复杂标题的表?
、
、
、
、
我尝试使用很多库来从
PDF
中提取
表格
,比如: camelot,tabula,PDFPlumber,PDFTabExtract…但是他们不会给出一个好的结果。使用camelot,我不能有一个适用于我
PDF
中所有页面的脚本。使用Tabula时,当
表格
有一个旋转的文本标题时,我得到了一个令人困惑的数据帧。有没有什么办法可以让我在
pdf
中转换任何不同格式的
表格
?我知道我找不到一个通用的解决方案,但至少能给出一个好的结果。 我应该使用OCR吗?你有什么推荐的? 我真的很感谢任何结果。提前谢谢你。
浏览 13
提问于2019-06-10
得票数 0
1
回答
OCR可以
识别
PDF
文件吗?
浏览 243
提问于2022-06-15
2
回答
使用java从
pdf
中
识别
和提取
表格
、
、
、
我有不同类型的
pdf
,其中包含多个东西,如
文字
,
表格
等。该表可能存在任何地方的
pdf
(顶部,中部,底部)。我只想提取表数据(否)。列上的,不。在不传递位置的情况下使用java从
pdf
中提取行和表中的数据。 我也使用过PDFBox java,但它也解决不了我的问题。我无法确定在哪里找到该
表格
的
pdf
浏览 12
提问于2017-03-31
得票数 1
2
回答
关于azure的形式
识别
器功能的问题
、
使用Microsoft azure进行
表格
识别
时,
表格
中的字符为中
文字
符。
表格
识别
功能能正常工作吗?
浏览 2
提问于2020-05-19
得票数 0
1
回答
OCR
表格
识别
V2是否支持
PDF
多页
识别
?
浏览 203
提问于2022-06-15
2
回答
Acrobat XI Pro喜欢
pdf
阅读器
、
、
我如何安装一个
PDF
阅读器,像“杂技XI专业”,让我突出文本,有
文字
识别
,让我组合和转换
PDF
格式和其他格式?
浏览 0
提问于2015-02-02
得票数 0
1
回答
Python读取
pdf
文件
、
如何使用jupyter实验室从
pdf
文件中读取和提取
表格
? 一个典型的
pdf
文件与文本之间的
文字
字幕和
表格
。我需要编码来提取特定标题下的
表格
,并清理一些不需要的文本,比如页码。
浏览 3
提问于2022-09-19
得票数 -1
1
回答
获取
PDF
中嵌入的表数
、
下面的代码从
PDF
中提取
表格
。install.packages("tidyverse") n_tables <- extract_tables("filename.
pdf
我们是否可以绕过实际的
表格
提取步骤,直接使用tabulizer或任何其他R包从
pdf
中获取
表格
计数?
浏览 3
提问于2018-08-22
得票数 0
1
回答
文字
识别
表格
识别
API端口设置?
浏览 231
提问于2022-06-15
1
回答
未捕获的单元:无法读取未定义的jspdf的属性“TypeError”
、
、
我有一个速度模板文件,我正在尝试将其转换为
pdf
。在谷歌了一下之后,我发现了一个名为JSPDf的框架。function html_to_
pdf
() { // source can be HTML-formattedAJS.log(
pdf
) source = $('#productcanvas')
浏览 0
提问于2015-08-31
得票数 4
4
回答
如何使用Python从
PDF
中提取表作为文本?
、
、
我有一个
PDF
,其中包含
表格
,
文字
和一些图像。我想从
PDF
文件中的任何位置提取
表格
。 PDFfilename = "Sammamish.
pdf
" #filename of your
PDF
/directory where your
PDF
is storedPdfFileWriter() #create
浏览 4
提问于2017-11-28
得票数 47
回答已采纳
2
回答
如何使用Tesseract从车辆的认证卡中获取文本区
、
、
我需要关于tesseract的建议。我尝试过使用Tesseract,但效果并不完美。很多信息都丢失了。我想扫描法国车辆的登记证书,我必须将数据恢复到数据库中。你可以在下面的文件中找到,这是一份法国注册证。是否有可能检测到本文档中的每个区域并将此信息保存在数据库中?我在网上读过,只用Tesseract是不可能检测到区域的?示例:如何恢复每个区域的文本并将其插入到数据库中?尼古拉斯
浏览 19
提问于2017-02-17
得票数 0
1
回答
查找没有文本的
PDF
、
、
我有很多文件夹与很多
PDF
,我想要光学字符
识别
那些没有
文字
层。所以首先,我想找到他们。我以为也许用pdfgrep的烟斗就能做好这份工作,但我迷路了。 如何找到没有文本的
PDF
?
浏览 0
提问于2021-01-15
得票数 5
回答已采纳
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中的文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中的文本。 所有都是一样的,
浏览 1
提问于2019-03-07
得票数 0
2
回答
可将OCR文本插入回源
PDF
的OCR库
、
是否有库(或可执行文件)可以OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
如何使用python
识别
pdf
中的图形?
、
、
、
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
Azure Language Studio没有显示有关OCR的python脚本中的文本内容
、
、
我正在研究word文档的OCR,以
识别
文档中提到的内容。我注意到OCR生成的python代码没有在语言工作室中自动生成python脚本中显示文档中可用的内容。我只想得到python脚本结构,在那里我可以看到标记,这些标记专注于
识别
没有表内容的句子。 我要找的方法对不对?任何解释需求的流程都是非常感谢的。
浏览 14
提问于2022-06-15
得票数 -1
回答已采纳
2
回答
如何确定
PDF
是否被标记?
、
我如何知道
PDF
是否被标记?我正在开发一个程序,可以在
PDF
文件中复制一个文本并在我的应用程序中显示它,所以我尝试测试这个
PDF
文件,我从一个
PDF
文件(普通Copy+Paste)中复制了一个表,并将它粘贴到MS中。结果是没有
表格
的普通文本。当您从
pdf
文件中复制表并将其粘贴到Word中时,会出现一些问题,使其成为图像。这是真的吗?
浏览 6
提问于2012-10-04
得票数 2
回答已采纳
点击加载更多
相关
资讯
如何识别表格的文字?表格识别软件哪个好?
怎么识别pdf中的文字?这有pdf的文字识别方法
如何使用金鸣表格文字识别小程序、APP批量识别图片为表格
pdf文字识别,教你一个提取pdf文字的方法
PDF文字识别软件哪个好?试试这些PDF识别软件吧
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券