腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
从
PDF
中提取文本,并将提取的文本保存在
Excel
或其他地方
、
我想要一个简单的方法,从
pdf
中提取文本,并将文本保存到
Excel
中。 谢谢!
浏览 16
提问于2020-07-13
得票数 0
3
回答
将手写数字转换为文本
、
我需要转换一个包含手写数字列的
pdf
表单为文本,并填充一个
excel
电子表格。提前谢谢。
浏览 9
提问于2012-09-05
得票数 1
1
回答
将扫描的
PDF
表格转换为
Excel
、
、
、
我有一个扫描的
PDF
,其中有一些表格格式的随机数据,并希望将其复制到
Excel
工作表。 我试过使用数字
PDF
,使用'tabula‘来提取表格,但扫描的
PDF
需要
OCR
(我在google上看到的)。我知道涉及到
OCR
(Tesseract),但不知道我应该采取什么方法来解决这个问题。
浏览 7
提问于2019-06-20
得票数 0
2
回答
如何向只包含图像的
PDF
中添加文本?
、
我使用像富士通iX500 ScanSnap扫描仪这样的硬件解决方案进行实时扫描,同时使用Foxit PhantomPDF向
PDF
中的图像添加文本。这两种解决方案都带来了不错的
OCR
,但是也有一些缺陷,比如在非文本上出现错误,或者99%的文本在页面上被漏掉,因为页面的角落中有3-4个单词与页面上的所有其他文本一样,它们都是90度旋转的。最先进的
OCR
解决方案是将图像转换为可搜索的
PDF
,还是将(隐藏的)文本添加到仅包含图像的现有
PDF
中(添加搜索功能)?
浏览 0
提问于2018-05-25
得票数 0
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
AttributeError:“NoneType”对象没有属性“语言”
目标:1.选择
PDF
2. tabels 3.使用单文件.exe扩展表格 File "
OCR
_Menu.py", line 26, in <module> File "ocrmypdf\_validation.py", line 240, in che
浏览 11
提问于2022-07-06
得票数 0
1
回答
PDF
数据的提取与挖掘
我有一个
pdf
档案(入学申请)。我想读取/搜索
pdf
和提取具有类似含义的术语,然后将这些数据转换为DataFrame以保存为xlsm文件。帮助!
浏览 0
提问于2020-01-08
得票数 2
3
回答
用嵌入式字体从
PDF
文件中提取文本
、
、
、
、
我有一个
PDF
文件包含一些表格数据。 然而,
OCR
解决方案并不十分精确(大约80%的单词匹配)
浏览 2
提问于2012-09-07
得票数 4
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
2
回答
如何将
PDF
转换为JSON/
EXCEL
/WORD文件?
、
、
、
、
我需要从
pdf
文件中获取数据及其标头,以便进一步与DB数据进行比较 我试着使用pdfbox,google vision
ocr
,itext,但是所有的库都没有结构和头文件。示例: Date\nNumber\nStatus\n12\12\2020\n442334\delivered 我会尝试将
pdf
转换为
excel
/word并从中获取数据,但为了实现这一点,我需要读取
pdf
并将数据写入
excel
/word。
浏览 54
提问于2020-04-17
得票数 0
回答已采纳
2
回答
为什么在升级到14.04之后,Gscan2
pdf
中没有
OCR
引擎工作?
、
、
我最近升级到Ubuntu14.04,但是gscan2
pdf
中的
OCR
停止了工作。我正在使用最新的gscan2
pdf
(1.2.4)与Tesseract和Cuneiform都可用。在gscan2
pdf
中加载
pdf
文档时,两个
OCR
引擎都是可用的,它们看起来都在工作,但没有输出。我尝试使用各种旧版本的gscan2
pdf
,但都没有效果。它在13.10的时候运行得很好。
浏览 0
提问于2014-04-25
得票数 2
11
回答
免费的
OCR
软件,使
PDF
可搜索(与可搜索的文本在正确的地方)
、
、
、
、
是否有任何免费的
OCR
软件(用于Linux和/或Windows)可以像Acrobat那样将
PDF
扫描文档作为输入并输出可搜索的
PDF
?使用可搜索的
PDF
格式,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。我知道Linux上的gscan2
pdf
可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景扫描页面上的文本完全不同步。这是因为gscan2
pdf
将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或小段落发送到<em
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
3
回答
具有自动旋转支撑的.TIFF图像
OCR
软件
、
、
、
是否有任何应用程序(例如Acrobat )可以使用
OCR
自动旋转它们,以确保它们的文本朝右?我知道有一种方法可以通过命令行界面来实现,但是我真的很想找到一个带有GUI的应用程序。
浏览 0
提问于2016-06-30
得票数 0
1
回答
我如何从谷歌图书的全景式图书中获得所有纯文本?
、
还有一个选项可以看到一定数量的纯文本:当你看到一本旧书的页面图像时,如果你点击右上角的齿轮图标,然后点击下拉菜单中的“纯文本”,你就可以看到几页的
OCR
纯文本。但我想得到所有页面的纯文本。不幸的是,无法通过下载
PDF
并使用Select和Copy访问这些斜体。因此,我认为能够从谷歌图书中获得“纯文本”是很重要的。
浏览 0
提问于2017-11-06
得票数 4
1
回答
用于搜索
pdf
中关键字并给出页码的宏
、
我想要一个
excel
宏,它可以在
PDF
中搜索单词,并给出宏找到单词的页码。我有20个单词,我想在
PDF
中搜索。我已将关键字输入到
excel
电子表格的coulmn A中,并希望在coulmn b中填充页码。
浏览 2
提问于2018-06-21
得票数 0
4
回答
从扫描创建copy+pastable
PDF
、
、
我有
PDF
文件,这是从扫描仪创建的。
PDF
只包含图像。
OCR
:从图像中读取文本一页的处理时间不应超过20秒。 命令行和/或API,不需要GUI。
浏览 0
提问于2018-06-05
得票数 1
3
回答
OCR
将扫描的
pdf
问卷转换为记录(csv,数据库)
、
任务是将填写在纸上的问卷转换成记录(输出可以是一个csv文件或
excel
表格,在数据库等)进行分析。
浏览 0
提问于2015-10-27
得票数 3
回答已采纳
2
回答
OCR
软件-将文件放入应用程序图标,将
PDF
转换为可搜索的文本
PDF
。
、
、
我正在寻找一个OS程序,将迅速和简单地转换一个
PDF
到一个可搜索的文本
PDF
。将
PDF
文件放到应用程序的图标上 该应用程序自动将
PDF
转换为可搜索的文本,然后覆盖原始文件。我目前有ABBYY FineReader和Acrobat,但这两个程序都没有提供快速拖放
OCR
转换。
浏览 0
提问于2016-09-26
得票数 1
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券