腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Tesseract
的
hOCR
文件
/
确定
是否
有
高质量
的
文本
层
、
我
有
一个
Tesseract
4.0设置,我们正在
使用
一个LSTM模型
的
OCR;传入
的
扫描PDF被解构成单独
的
300dpi上采样
的
PNG,然后去偏斜和OCR‘,然后重新组装成一个PDF与
文本
层
,同时也保存每个页面有时,我们收到
的
PDF已经被专业地转录了
文本
层
,在这些
层
上运行
Tesseract
会导致准确性
的
损失。 对于机器学习应用程
浏览 11
提问于2018-02-14
得票数 2
2
回答
"sh: 1:不能打开/tmp/pdfsandwich4e375e.html:没有这样
的
文件
“当
使用
pdfsandwitch时
我试图添加一个
文本
层
到一些pdf
文件
,以使他们可以搜索。这一技术在德国
的
Ubuntu:http://wiki.ubuntuusers.de/pdfsandwich中得到了解释。对我
的
/tmp目录
的
检查表明,不存在这些*.html
文件
,而是存在相应
的
*.txt
文件
。从表面上看,
tesseract
不会以
hocr
格式输出。我阅读了
tesseract
浏览 0
提问于2013-06-16
得票数 1
回答已采纳
2
回答
Tesseract
-如何从图像中提取输入坐标的
文本
?
、
、
、
、
输入坐标中
的
文本
必须作为输出读取。如何
使用
node-
tesseract
完成此操作?
浏览 4
提问于2016-12-19
得票数 0
1
回答
如何从PDF中提取
hocr
文件
?
我正在通过
tesseract
创建一个OCR编辑
的
PDF:但我也需要
hocr
和txt
文件
。
tesseract
已经解决了这个问题
的
最新版本,但是由于它需要编译leptonica和
tesseract
,所以我对它并不完全满意。我可以
使用
pdftotext提取
文本
文件
,但我似乎找不到从PDF中提取
hocr
的
方法。
浏览 0
提问于2016-04-19
得票数 6
回答已采纳
3
回答
如何
使用
python-
tesseract
获取
Hocr
输出
、
、
我
使用
pytesseract得到了非常好
的
结果,但它不能保留双空格,它们对我来说真的很重要。因此,我决定检索
hocr
输出,而不是纯text.But;there似乎不是
使用
pytessearct指定配置
文件
的
任何方式。那么,
是否
可以
使用
pytesseract指定cofiguration
文件
,或者
是否
有
一些默认
的
配置
文件
可以更改以获得
hocr
输出?`
浏览 4
提问于2015-12-13
得票数 5
2
回答
检测
Tesseract
OCR Java实现
的
大小大小
、
、
、
、
是否
可以
使用
Tesseract
OCR来OCR图片并识别图片中不同大小
的
字体。如果是,我需要
使用
任何其他第三方库还是可以
使用
纯Java。举个例子 我想用字体大小来检测报纸
的
标题和内容。
浏览 3
提问于2014-09-21
得票数 3
1
回答
从tika-server获取
hocr
输出
、
、
、
我正在
使用
对PDF
文件
执行OCR操作。在和之后,我尝试
使用
X-Tika-OCR... headers配置
Tesseract
。在本例中,我
使用
的
是X-Tika-OCRoutputType:
hocr
header,但是我获得了纯
文本
输出或没有
HOCR
标记
的
html输出。 我尝试了/tika和/rmeta端点。我
浏览 5
提问于2020-01-09
得票数 2
回答已采纳
6
回答
如何
使用
Tesseract
对文档进行分段,然后输出结果
的
边框和标签
、
、
我试图让
Tesseract
输出一个带有标签
的
边框
的
文件
,该
文件
由页面分割(pre )产生。我知道它必须能够做到这‘开箱’,因为在ICDAR比赛中显示
的
结果,参赛者必须分割和各种
文件
()。下面是论文中
的
一个例子,说明了我想要创造
的
东西: 我
使用
brew,brew install
tesseract
--HEAD构建了
tesseract
的
最新版本,并一直试图编辑
浏览 11
提问于2015-02-18
得票数 37
回答已采纳
1
回答
在tiff
文件
有
600-700页
的
情况下,
是否
有
任何方法可以
使用
tesseract
OCR引擎加速提取?
、
、
在处理带有
hocr
选项
的
Tesseract
OCR引擎
的
600 - 700页
的
tiff
文件
期间,我们监视到
文件
占用了40-50分钟。我们
有
办法加快这一进程吗?以下命令
使用
:- <Drive>:\
Tesseract
-OCR>
tesseract
.exe "Source_Tiff_File"
浏览 0
提问于2015-04-18
得票数 0
1
回答
AttributeError:模块'pytesseract‘没有属性'run_
tesseract
’
、
、
、
我试图
使用
run_
tesseract
函数来获得一个
hocr
输出,用于从银行收据images.However
的
图像中提取
文本
,我得到了上述错误消息。我在我
的
笔记本电脑上安装了
Tesseract
-OCR,并将它
的
路径添加到我
的
系统路径变量中。我
有
一个windows 10 64位操作系统,pytesseract.pytesse
浏览 0
提问于2019-05-24
得票数 2
回答已采纳
1
回答
tesseract
OCR中
的
标记字体样式(斜体)
、
、
、
已在Windows 7上安装
tesseract
-ocr v3.02.02,并已通过命令行
使用
:我需要它能够标记输出
文本
或html
文件
中
的
任何斜体
文
浏览 2
提问于2014-09-22
得票数 0
1
回答
在图像中查找已知
文本
(引导OCR)
、
我在寻找一种在图像中定位已知
文本
的
方法。 具体来说,我正在创建一个工具,将一组扫描页面转换为支持搜索和copy+paste
的
PDF。我理解这通常是如何做到
的
: OCR页面,保留
文本
的
位置,然后将
文本
作为不可见
层
添加到PDF中。Acrobat具有此功能,
tesseract
可以输出
hOCR
文件
(包含识别的
文本
及其位置),
hocr
2pdf可以
使用
这些<
浏览 3
提问于2015-02-23
得票数 4
5
回答
如何在
tesseract
中保留文档结构
、
我
使用
tesseract
ocr从图像中提取
文本
。保存这份
文件
的
结构对我来说非常重要。目前,
tesseract
没有保留
文本
的
结构,实际上它改变了
文本
的
顺序。我
的
输入是下面的图片。Someto the leftSome in the middle Some with some t
浏览 4
提问于2014-03-24
得票数 25
回答已采纳
3
回答
使用
文本
信息执行OCR时出错: read_params_file:无法打开deu
、
在指定用于执行OCR
的
语言包时,我得到以下错误(对应
的
每个语言包):我
使用
了wiki中描述
的
命令:tessdata
文件
位于tessdata下,TESSDATA_PREFIX设置为tessdata
的
父目录。该过程在缺省情况下工作,没有给定
的
语言信息。 我在Windows 10上安装了
Tesseract
浏览 0
提问于2016-07-15
得票数 5
回答已采纳
1
回答
Tesseract
hocr
字符输出
我正在
使用
Tesseract
可移植版本3.02,并希望获得
hocr
输出
的
字符。问题是
hocr
输出只显示单词
的
购买框,而不显示字符,如果有人知道
是否
有
一个选项可以更改tessdata/config,请告诉我。否则,让我知道,如果有另一种方法来解决这个问题。我无法在计算机上安装任何东西,所以我不能
使用
Tesseract
API方法。只能
使用
dll
文件
。
浏览 1
提问于2015-11-11
得票数 1
回答已采纳
3
回答
Php api用于从我们上传
的
图像中读取任何
文本
、
我需要帮助从图像中读取
文本
,无论我们upload.Is有没有任何库为此。我正在
使用
Tesseract
PHP OCR。 但不知道如何
使用
它。我在这里附上了我
的
文件
。
Tesseract
文件
来自这里:和我
的
php我已经写了附加
的
图像。
浏览 3
提问于2017-05-04
得票数 0
2
回答
Pytessaract image_to_pdf_or_
hocr
函数在AWS中不工作
、
、
、
我
使用
这个存储库将
tesseract
部署为lambda
层
:pdf = pytesseract.image_to_pdf_or_
hocr
(f'/tmp/{file_name}/{page.numberas output_fi
浏览 3
提问于2021-03-15
得票数 3
2
回答
从具有不同结构
的
表单中提取字段
、
、
例如,我希望能够指出以下资产负债表
的
“Inventory”值为1,277,838:目前,我正在
使用
Tesseract
将图像转换为
文本
。但是,这种转换会产生
文本
流,因此很难将字段与它们
的
值相关联(因为这些值并不总是紧挨着其相应字段
的
文本
)。 经过一些搜索,我读到了
Tesseract
可以
使用
uzn
文件
来读取图像
的
区域。然而,资产负债表值
的
特定区域可能会从一
浏览 0
提问于2017-03-29
得票数 12
回答已采纳
2
回答
如何获取识别字符
的
坐标
我
有
一个非常简单
的
基于
Tesseract
的
OCR应用程序。在识别步骤之后,我还提供了一个用户验证步骤,允许在OCR错误
的
情况下进行纠正。为了改善用户界面,我计划在原始输入图像上
的
OCR编辑字符顶部绘制一个矩形,并将其与OCR输出并排放置。为了达到这个目的,我需要识别字符
的
坐标。output; text = tess->GetUTF8Text(); 现在,如果我访问output->c
浏览 10
提问于2011-09-06
得票数 5
1
回答
如何在iOS中生成包含嵌入式
hocr
数据
的
pdf?
、
、
、
、
我
使用
ocr客户端
tesseract
在
hocr
文件
中生成ocr
文本
和位置数据。我想要顶部创建一个pdf从图像与一个不可见
的
一
层
文本
,从
tesseract
内嵌入。我不知道该怎么做。生成一个不需要
文本
数据
的
pdf很容易:UIImage *image = [UIImagestringByAppe
浏览 7
提问于2013-05-13
得票数 0
点击加载更多
相关
资讯
python人工智能-图像识别
用Python建一个OCR服务器,直接提取图中的文本
如何使用Python检测和识别车牌?
Python创建一个车牌检测和识别程序
怎么识别图片中的文字?这三种方法了解一下
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券