腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
3
回答
是否有用于图像扫描的可可框架?
、
、
、
、
对于
Mac
OS X上的图像扫描框架,我有哪些选项?我不是在找
OCR
库。只是一些东西,将做实际的扫描和导入
PDF
或类似的格式。
浏览 0
提问于2010-08-31
得票数 6
回答已采纳
4
回答
哪些工具可以在
Mac
上将扫描过的纸张文件转换成可搜索的文本
pdf
?
、
、
、
、
我需要将扫描文档转换为
mac
上可搜索的文本
PDF
。它不需要免费,只需要比Acrobat更低的成本。
浏览 0
提问于2015-03-02
得票数 2
回答已采纳
1
回答
要将
OCR
转换为计算机字体
、
、
、
、
我的
pdf
文本太模糊了。所以我想把它从扫描图像转换成计算机字体,我已经尝试了通过adobe/编辑/preferences/页面显示来提高质量。任何操作系统都是可以接受的,任何价格。
浏览 0
提问于2021-01-14
得票数 1
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
如何将
PDF
转换为具有尽可能高质量的Python的JPG/PNG?
、
、
、
我正在捆绑一个
PDF
转换成一个图像,以便我可以
OCR
它。但在转换过程中,质量正在下降。pages = convert_from_path(filename="page.jpg") 但是,如果我只是在
Mac
上截图
PDF<
浏览 11
提问于2022-03-01
得票数 3
1
回答
在r中的
pdf
上执行
ocr
时出错
、
、
、
、
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
2
回答
扫描文件作为可搜索的
PDF
-工作流程是什么?
我已经学会了如何将文档扫描到
PDF
文档中,但是,我想确保我的
PDF
文档有可搜索的文本--我认为技术术语是
OCR
,但我完全搞不懂。 我可以用我的扫描仪把文件扫描到
PDF
中。但是,如果我正确理解,我无法使他们
OCR
搜索,除非我使Acrobat和/或ABBYY精细阅读器的工作流程的一部分。(顺便说一下,我用的是一台运行小牛的
Mac
电脑。)我想我需要问的第一件事是:我需要什么软件来创建一个
OCR
可搜索的
PDF
?就像我说的,我已经安装了爱普生扫描仪软件
浏览 0
提问于2014-05-12
得票数 0
回答已采纳
1
回答
带有图像的
PDF
文件的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
如何将
pdf
文件转换为
ocr
pdf
文件
、
我有一个问题,我需要转换一个
pdf
文件到
OCR
pdf
文件,就像Adobe Acrobat的工作方式。我已经尝试过使用ocrmypdf模块,但不知何故它不起作用。我使用的是python 2.7。loggingimport subprocessimport time print (filename) input_path=os.path.joi
浏览 13
提问于2019-02-12
得票数 0
1
回答
更新多个列,使其与另一列相等
、
例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。
OCR
0000000001 Yes 100 06000093.
pdf
OCR
0000000004
OCR
0000000006 No 95
浏览 0
提问于2014-03-22
得票数 0
1
回答
两种输入文件类型同时在GNU并行?
、
、
、
然后它将使用tesseract对每个pgm (第二个输入文件类型)执行
OCR
。 export -f generate_pgm PGM="$1" find .{}; parallel --argsep ,,,
ocr
,,, pgm/*.pgm'
浏览 2
提问于2017-07-25
得票数 1
1
回答
将扫描的
pdf
转换为R中可搜索的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。有没有一种方法可以将扫描的
pdf
转换成可读的
pdf
,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
1
回答
无法通过Jpedal解析
pdf
、
、
在从Jpedal中读取wordlist时,我在wordslist中得到了混淆的字符。在使用
OCR
时,以及当我从
PDF
中复制文本并粘贴到Word或简单的文本编辑器时,也会发生这种情况。据我所知,这个
PDF
是由Quartz
PDF
上下文在
MAC
10.6.4上生成的,它用于压缩文件大小,但在查看器上很容易查看。我搜索了任何支持解码这种
PDF
的Java,但都失败了。
浏览 4
提问于2010-07-02
得票数 2
1
回答
检测景观格式的图像,并将其分割成两幅肖像。
、
、
、
、
我已经扫描了
PDF
格式的文件。这些文件包含一页纵向格式和两页横向格式的页面。for i in *.
pdf
; # Créer le fichier
PDF
avec
OCR
ocrmypdf --language fra
浏览 2
提问于2020-04-20
得票数 1
3
回答
将
pdf
的内容读取为字符串
、
、
如何将
PDF
的内容以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。
PDF
来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.
pdf
, encoding: NSUTF8StringEncoding, error: nil) 但是,我认为这是无
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
1
回答
如何在perl中安装
PDF
::
OCR
2模块?
、
、
、
我正在尝试使用perl从扫描的
PDF
中获取文本,所以我在perl中使用了
PDF
::
OCR
2模块,但我无法安装此模块,安装Image::
OCR
::Tesseract模块失败,我使用的是CentOS7,这是我在安装过程中的错误NOT OK reports LEOCHARRE/
PDF
-
OCR
2t
浏览 17
提问于2016-08-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Mac上怎么编辑PDF文件?Mac上好用的PDF编辑器分享
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
PDF Checkpoint mac版(pdf批量处理软件)
通用 PDF OCR 到 Word API 数据接口
PDF Expert for mac(pdf编辑工具)v2.5.13
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券