腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
AttributeError:模块“ocrmypdf”没有属性“
ocr
”
、
、
我正在使用ocrmypdf库将扫描的
pdf
转换成
可搜索的
pdf
,但我得到了这个错误。这是我目前正在运行的代码ocrmypdf.
ocr
('/content/drive/MyDrive/Dataset 2020/
OCR
/1081975.
pdf
', 'output.
pdf
')AttributeError: module '
浏览 5
提问于2020-11-24
得票数 1
回答已采纳
3
回答
为什么
pdf
2image给我一个空白的图像文件?
、
、
、
、
我试图使用Tesseract
OCR
在多个大
pdf
文件上执行
OCR
(~400-600页)。我不一定要从所有页面中提取文本,但我只想要几页(页码已知)。
PDF
文件似乎已经在上面执行了某种
OCR
,但这不是一个好工作。0].show()这就是输出应该是什么样子: 我确实认为在
PDF
上进行的
OCR
在这里引起了一些问题。我不知道
怎么
绕过它,有人能帮忙吗? 我也尝试了
OCR
,手动将页面
转换成
图
浏览 10
提问于2021-06-06
得票数 2
3
回答
OCR
图形纸
我想把一个扫描过的图形纸笔记本(有手写)的
pdf
格式
转换成
一个文本文件。谢谢
浏览 6
提问于2009-06-20
得票数 1
1
回答
Python for
OCR
中的图像预处理
、
我正在对python中的
OCR
图像进行预处理。我把
pdf
转换成
了二进制图像。我得到的输出如下所示我希望输出结果是这样的你知道该
怎么
做吗?
浏览 2
提问于2017-03-14
得票数 0
1
回答
带有
OCR
松散
OCR
的ps2
pdf
我已经寻找了大量的时间来转换ps2
pdf
与
OCR
。所发生的事失去了
OCR
。
pdf
2ps test.
pdf
test.psgswin64 -sDEVICE
浏览 1
提问于2020-05-26
得票数 1
回答已采纳
1
回答
在尝试解析具有文本包含图像的
pdf
时使用Apache tika解析器的问题
、
、
、
、
我使用这两个依赖项:- tika核心2.6.0tika解析器标准包2.6.0 .Parsing在这些情况下很好地工作:-
pdf
文件和文本。
pdf
文件与图像。文本文件和其他扩展名。对于下面的用例-
pdf
文件和图像中的文本,
pdf
分析器运行时异常的解析失败。 有人能在这里建议如何解决失败的案件吗?(PDFTextStripper.java:365) ~org.apache.pdfbox.pdfbox-2.0.27.jar:2.0.27 at org.apache.tika.parser.
pdf
.
P
浏览 19
提问于2022-11-11
得票数 0
1
回答
在Tesseract
OCR
中是否有从
PDF
中查找字符串和删除页面的属性?
、
、
、
、
我试图在Tesseract
OCR
中将Image
转换成
文本
PDF
。在中间,我需要检查封面页,并从结果中删除。在Tessaract
OCR
中是否可以根据封面的特定属性(封面文本匹配)来识别封面。或者,我是否需要获取tessetact
OCR
结果的全部输出,并提供我的逻辑来扫描
PDF
和删除封面页。我非常困惑,任何帮助都将不胜感激。
浏览 1
提问于2018-09-20
得票数 0
回答已采纳
1
回答
使用Ghostscript将扫描的
PDF
转换为纯文本
、
、
我知道有一种方法可以使用将scannedPDF文档转换为
OCR
'd
PDF
文档,使用以下命令:它使用开源来做到这一点。根据,它可以
转换成
另一个
PDF
文档,而不仅仅是简单的文本(而tesseract也可以
转换成
纯文本)。
浏览 1
提问于2021-03-04
得票数 0
2
回答
使用imagemagick将.
pdf
文件中的页转换为.png图像
、
、
、
、
我正在使用Imagemagick将我的.
pdf
文件转换为.png映像$convert sample.
pdf
image.png当我们在google文档.
pdf
查看器中查看我们的.
pdf
文件时,它们也是图像格式的。
浏览 3
提问于2010-09-30
得票数 3
回答已采纳
4
回答
是否有任何web应用程序可以将
PDF
转换为word (或html),并为表提供良好的支持?
、
是否有一个web应用程序可以将
PDF
文件转换为word (或html)文件,包括恢复表?(我希望将
PDF
规范
转换成
我可以用来驱动系统测试的格式) 我还没有接受一个答案,如果有人想写一个答案,比较不同的选择,我会接受它。
浏览 0
提问于2010-07-17
得票数 1
回答已采纳
1
回答
Python
OCR
Sudoku图像
、
我需要使用
ocr
来转换sudoku图像上的数字,并将其作为网格读取。
浏览 3
提问于2022-06-16
得票数 0
1
回答
如何将可搜索文本添加到图像中?
、
我需要添加文本到图像(原始图像可以是jpg,gif,或bmp)文件,我
怎么
做呢?我把带有快门的文本添加到一个jpg中,并
转换成
pdf
格式。Tesseract无法将这些图像中的文本转换为真正的文本。添加已经可以搜索到图像的文本似乎更容易(而不是用
OCR
添加和处理文本)。我唯一的选择是创建一个
pdf
并将图像和文本添加到其中吗?如果是的话,我该
怎么
做?
浏览 0
提问于2014-10-30
得票数 1
7
回答
如何将
pdf
转换成
文本可搜索的
pdf
?
、
、
我有一些扫描文件的
pdf
,我想能够搜索他们。我
怎么
能这么做?治夹心三明治 (软件中心说它是一个很差的软件包,我不应该安装它) OCRfeeder (在软件中心)很好地导出到odt,但在导出到
pdf<
浏览 0
提问于2014-05-29
得票数 36
回答已采纳
1
回答
从
PDF
中提取文本在R中返回奇怪的结果
、
、
我试图从一堆
PDF
文件中挖掘文本,但当我使用pdftools包中的
pdf
_text将它们读取到R中时,它产生的文本就是奇怪的,与
PDF
文件中的实际内容完全不同。link驱动器链接:。下面是我使用的示例代码:
pdf
1 <-
pdf
_text("https://dl.dropboxusercontent.com/s/308gpdijvnw18mf/2018REQ118030709.
pdf
?
浏览 14
提问于2018-03-03
得票数 3
回答已采纳
1
回答
将
pdf
转换为图像,但在放大后
、
、
、
、
此link显示如何将
pdf
%s转换为图像。有没有办法在
转换成
图片之前缩放我的
pdf
?在我的项目中,我将
pdf
%s转换为png%s,然后使用Python-tesseract库提取文本。我注意到,如果我缩放
OCR
s,然后将部分保存为pngs,那么
pdf
会提供更好的效果。那么有没有办法在
转换成
png之前缩放
pdf
文件呢?
浏览 41
提问于2019-03-23
得票数 6
回答已采纳
1
回答
将abbyy XML转换为可读格式
、
、
、
这个XML似乎是Abbyy程序的输出(大概是基于实际书籍的
OCR
)。 我正在寻找软件,这些文件被
转换成
某种可读的东西。我希望
PDF
输出,但HTML或电子书格式是可以的,如果它将允许阅读文本。网络搜索是无用的,因为它只是带来无穷无尽的结果,要么使用Abbyy商业软件,要么
转换成
XML,或者从
PDF
,或者做
OCR
。
浏览 0
提问于2019-04-15
得票数 1
1
回答
以编程方式搜索多个
PDF
文档以获得一系列关键字
问题keyword-set-1 = "foo" "bar";和一个
PDF
文件,其中包含以下文本 "jon doe and然而,我还没有找到一个
PDF
文件的解决方案。我考虑过使用
PDF
矿工将所有
PDF
<e
浏览 4
提问于2014-02-15
得票数 0
1
回答
如何使用C#从扫描的
PDF
文档中提取文本?
、
、
、
该应用程序正在寻找
PDF
文档中的特定模式,并根据该模式将其上传到任何需要的位置。它与
PDF
没有任何问题,
PDF
是用数字方式编写的(Word、Nodepad等)。然后
转换成
PDF
格式。我找到了多个第三方库,它们可以处理这个任务-> iText7、LeadTools、ABBYY、WhatsMate
PDF
到text API、SautinSoft .NET Offce Edition。我有一个想法,把
PDF
转换成
任何图像类型(jpg,png,tiff等
浏览 18
提问于2021-01-05
得票数 0
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换为可搜索的
PDF
?
、
、
、
我想使用Google 将不可搜索的
PDF
转换成
可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传文件到另一个网站或下载的文件,以进行转换。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat如何进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们
转换成
文本或文档文件。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
点击加载更多
相关
资讯
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
pdf怎么转换成word,pdf怎么变成word文档
jpg怎么转换成pdf?
png怎么转换成pdf?
PDF怎么转换成Word?
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券