腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
从扫描创建copy+pastable
PDF
、
、
我有
PDF
文件,这是从扫描仪创建的。
PDF
只包含图像。
OCR
:从图像中读取文本一页的处理时间不应超过20秒。如果有API,
Python
绑定就更好了。 我只需要支持Linux,不需要其他操作系统。开放源码优先,但商业软件建议也是有效的答案。
浏览 0
提问于2018-06-05
得票数 1
1
回答
运行OCRmyPDF时出现的问题: WinError2和无效版本号
、
、
、
、
因此,我将一个简单的
Python
脚本组合到
OCR
,一个
PDF
:from tika import parserimport(image_path) raw_text_from_
ocr
_
pdf
= get_text_from_
pdf
()/temp_<em
浏览 3
提问于2021-06-14
得票数 1
回答已采纳
2
回答
如何在
Python
(Mac)中将扫描的
PDF
转换为可搜索的
PDF
?例如OCRMYPDF模块
、
我正在用
python
编写一个程序,可以读取
pdf
文档,从文档中提取文本,并使用提取的文本重命名文档。首先,扫描的
pdf
文档是不可搜索的。我想把
pdf
转换成可搜索的
pdf
在
Python
上,而不是使用谷歌文档,Cisdem
pdf
转换器。 我已经读到了ocrmypdf模块,可以用来解决这个问题。我期望输出将扫描的
pdf
转换为可搜索的
pdf
。
浏览 0
提问于2019-08-08
得票数 4
1
回答
如何在
Python
中运行docker命令
、
我正在使用
python
包从
python
运行docker。下面是我尝试使用
python
包运行的docker命令:下面是<em
浏览 0
提问于2018-10-25
得票数 0
回答已采纳
1
回答
pytesseract给出错误PermissionError:[WinError 5]访问被拒绝
、
、
、
我在
Python
中使用pytesseract作为
pdf
。但是我在Windows10中得到了权限错误。我使用的是
python
3.8.0 import
pdf
2imageimport os from PIL import Image print('
pdf
_file = ',
pdf</em
浏览 505
提问于2020-09-24
得票数 0
1
回答
如何从
pdf
2image中的文件存储对象读取
PDF
?
、
我正在使用烧瓶,在那里,我上传一个
pdf
文件,将其转换成一个图像,并执行
OCR
使用pytesseract。 File "/home/ubuntu/Credit_Scoring/API_Script/
ocr
_script/certificate_of_incorporation/coi_
ocr
_script_
pdf
.py
浏览 17
提问于2022-01-21
得票数 0
2
回答
Python
&
PDF
解析:有任何现代的、强大的、维护良好的开源库吗?
、
、
、
、
我正在寻找维护良好和文档齐全的
Python
强大
PDF
解析库(主要用于从具有不同/不可预测结构的各种类型的
PDF
中提取和解析数据,包括借助可靠和强大的
OCR
)。用于
PDF
的现代表解析器与Camelot (https://github.com/camelot-dev/camelot) -> --这是一个伟大的项目,但目前只涉及
PDF
中表的解析。另外,它似乎依赖于PyPDF2 & PDFMiner.six来实际读取
PDF<
浏览 0
提问于2019-11-14
得票数 4
回答已采纳
1
回答
使用
python
从
PDF
中提取扫描页面
、
我有很多
PDF
文件,基本上是扫描文档,所以每一页都是一个扫描图像。我想要执行
OCR
并从这些文件中提取文本。我尝试过pytesseract,但它不直接对
pdf
文件执行
OCR
,因此,作为一项工作,我希望从
PDF
文件中提取images,将它们保存在目录中,然后直接在这些图像上使用pytesseract执行
OCR
。在
python
中有没有从
pdf
文件中提取扫描图像的方法?或者有任何方法可以直接对
pdf
文件执行
OCR
?
浏览 1
提问于2018-05-26
得票数 0
回答已采纳
1
回答
PIL.UnidentifiedImageError:_cannot标识图像文件
、
、
我有这个错误: 回溯(最近一次调用):文件"/Users/fatiatravaille/Downloads/
ocr
_json/test.py",第8行,在"/Library/Frameworks/
Python
.framework/Versions/3.9/lib/
python
3.9/site-packages/PIL/Image.py",= Image.
浏览 170
提问于2021-09-23
得票数 0
1
回答
Python
OCR
Sudoku图像
、
我已经搜索并找到了下面的
python
代码,但是它没有像预期的那样返回结果。我需要使用
ocr
来转换sudoku图像上的数字,并将其作为网格读取。
浏览 3
提问于2022-06-16
得票数 0
1
回答
检查
PDF
可搜索是否已被
OCR
或
PDF
可搜索的事实
、
、
、
、
是否有任何
Python
方法来识别
PDF
是否是
OCR
的(文本的质量很差)和可搜索的
PDF
(文本的质量是完美的)?4) doc_info =
pdf
_file.getDocumentInfo()我发现: result = get_doc_info(
PDF
_SEARCHABLE_HAS_BEEN_OCR
浏览 6
提问于2021-09-16
得票数 0
回答已采纳
1
回答
找不到源-
pdf
?
、
、
、
、
我想用格拉姆普df将一些
pdf
文件从图片转换成可读的
pdf
-importocrmypdf fn = r"C:\Users\Polzi\Documents\DEV\
Python
-Diverses\PDFOCR\invoice.
pdf
" ocrm
浏览 0
提问于2022-01-14
得票数 1
回答已采纳
1
回答
使用pypdfocr的Alfresco上的
OCR
文件
、
、
、
、
我不能在Alfresco上使用pypdfocr的
OCR
文件。# PYPDFOCR
ocr
.output.verbose = true
ocr
.extra.c
浏览 9
提问于2020-08-30
得票数 0
回答已采纳
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
Google函数不返回响应
、
、
、
、
我在Google云函数https://
ocr
.space/ocrapi上使用这个api,这是我已经部署的函数 request_json =url = request_args['url'] url = 'http://www.africau.edu/images/default/sample.
pdf
'helloworld
浏览 3
提问于2019-05-28
得票数 2
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
3
回答
我无法安装pyPDF包根本找不到适用于pyPdf的发行版
、
、
、
.PyPDFLite - Simple
PDF
Writer.pyPdf-
PDF
toolkit PyPDF2 -
PDF
too
浏览 10
提问于2014-02-24
得票数 4
1
回答
bash -检查字符串变量是否等于表单提要
、
我正在尝试编写一个简单的bash脚本来检查一个
pdf
是否需要
OCR
,它使用的是与Xpdf一起分发的pdftotext可执行文件。如果pdftotext没有输出任何文本,那么
PDF
需要是
OCR
的,问题是,如果一个
PDF
还没有输出,pdftotext就会返回一个表单Feed字符(而不仅仅是一个空字符串)。这是我的密码:
pdf
_txt=$(pdftotext -q -l 5 '/Path/to/
pdf
/test.
pd
浏览 2
提问于2014-07-21
得票数 2
回答已采纳
2
回答
如何在
pdf
文件中复制图像中的文本?
、
、
我可以使用evince文档查看器使用文本查看
pdf
图像,但是我不能选择图像中的文本来复制和粘贴。如何在
pdf
文件中从图像中复制文本?
浏览 0
提问于2014-09-19
得票数 0
1
回答
在
PDF
中用
python
执行
OCR
有可能吗?
、
、
、
在
PDF
中用
python
执行
OCR
有可能吗?我正在尝试构建一个程序,从每一个
PDF
表格中提取一些信息,比如Autodesk BIM360所做的事情。
浏览 6
提问于2022-05-26
得票数 -2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
通用 PDF OCR 到 Word API 数据接口
用python的OCR实现自动截图搜题
告别「复制+粘贴」,基于深度学习的OCR,实现PDF转文本
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券