腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
在r中的
pdf
上执行
ocr
时出错
、
、
、
、
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
1
回答
带有图像的
PDF
文件的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
5
回答
在windows XP上运行的开源
OCR
库
我在找在windows XP上运行的开放源码的
OCR
库。我需要这为图像和
PDF
的工作。大多数情况下,我想从java
接口
这个库。你知道有没有可用的东西? 致以问候。
浏览 13
提问于2013-04-24
得票数 0
1
回答
更新多个列,使其与另一列相等
、
例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。
OCR
0000000001 Yes 100 06000093.
pdf
OCR
0000000004
OCR
0000000006 No 95
浏览 0
提问于2014-03-22
得票数 0
1
回答
两种输入文件类型同时在GNU并行?
、
、
、
然后它将使用tesseract对每个pgm (第二个输入文件类型)执行
OCR
。 export -f generate_pgm PGM="$1" find .{}; parallel --argsep ,,,
ocr
,,, pgm/*.pgm'
浏览 2
提问于2017-07-25
得票数 1
3
回答
开源
OCR
、
、
、
、
我正在寻找一个在Linux上运行的开源
OCR
库。我需要这个工作的PNG和
PDF
。大多数情况下,我想从java或ruby
接口
这个库。你知道有没有可用的东西? 致以问候。
浏览 3
提问于2011-03-01
得票数 17
1
回答
将扫描的
pdf
转换为R中可搜索的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。有没有一种方法可以将扫描的
pdf
转换成可读的
pdf
,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
1
回答
检测景观格式的图像,并将其分割成两幅肖像。
、
、
、
、
我已经扫描了
PDF
格式的文件。这些文件包含一页纵向格式和两页横向格式的页面。for i in *.
pdf
; # Créer le fichier
PDF
avec
OCR
ocrmypdf --language fra
浏览 2
提问于2020-04-20
得票数 1
3
回答
将
pdf
的内容读取为字符串
、
、
如何将
PDF
的内容以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。
PDF
来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.
pdf
, encoding: NSUTF8StringEncoding, error: nil) 但是,我认为这是无
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
3
回答
使用R在
PDF
中存储Tesseract输出
、
、
、
我正在尝试使用R
接口
来测试tesseract来创建一个包含嵌入式文本的
PDF
文件。我已经看到了前面的问题,但是它是关于使用命令行
接口
进行tesseract的。这个问题是关于R界面的。我将tessedit_create_
pdf
选项设置为1,但没有得到新的
pdf
文件。我没有看到设置输出文件的选项。如何使tesseract创建一个带有嵌入式文本的
pdf
?下面的代码在内存中生成很好的文本,但是没有
PDF
文件。tesseract(language = "eng"
浏览 9
提问于2021-08-29
得票数 1
1
回答
如何在perl中安装
PDF
::
OCR
2模块?
、
、
、
我正在尝试使用perl从扫描的
PDF
中获取文本,所以我在perl中使用了
PDF
::
OCR
2模块,但我无法安装此模块,安装Image::
OCR
::Tesseract模块失败,我使用的是CentOS7,这是我在安装过程中的错误NOT OK reports LEOCHARRE/
PDF
-
OCR
2t
浏览 17
提问于2016-08-19
得票数 0
1
回答
如何使用Apache Tika Server从
PDF
中提取内联图像并将其保存为文件?
、
我在对http://localhost:9998/tika的PUT请求中使用了以下标头"X-Tika-OCRLanguage", "eng""X-Tika-PDFOcrStrategy", "no_
ocr
" 响应
浏览 48
提问于2021-06-02
得票数 0
2
回答
导出从
PDF
中选择的页面作为可复制文本?
、
、
、
有时我需要从一个大
PDF
文件中导出几个页面。apt-get install poppler-utilsSyntaxWarning: Invalid Font Weight Syntax Warning: Invalid Fon
浏览 0
提问于2019-10-04
得票数 1
1
回答
使用google应用程序脚本(可能还有驱动器API)上传带有
OCR
的
PDF
、
、
我正在使用Google Apps脚本从web上传
pdf
,但我想在自动执行
OCR
的同时上传它。到目前为止,我可以上传它,但我不知道如何对它执行
OCR
。/" ; var link_end = "_DF.
pdf
不推荐使用的DocsList应用程序
接口
将一直使用到2015年,但我想要一个
浏览 2
提问于2013-01-19
得票数 1
回答已采纳
2
回答
用R做
OCR
、
、
、
、
我一直试图在R内做
OCR
(读取
PDF
数据作为扫描图像)。一直在读到这个@ lapply(myfiles, function(i){ # convert tif to text file shell(shQuote(paste0("F:/Te
浏览 7
提问于2015-08-13
得票数 14
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券