腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9130)
视频
沙龙
1
回答
Tesseract
/
Leptonica
处理
单
页
和
多
页
图像
的
正确
方式
?
、
、
、
我有一些关于在
Tesseract
(使用
leptonica
)中如何
处理
输入
图像
的
问题。我在这里尝试做
的
是有一个方法,可以
处理
任何
图像
文件(不需要特定
的
格式),并在稍后将其提供给
tesseract
API,但这似乎不是使用
leptonica
的
正确
方式
……string但不是我想要
的
<e
浏览 12
提问于2018-07-20
得票数 0
回答已采纳
1
回答
在生成PDF时,
Tesseract
能否设置为仅OCR (无
图像
修改)?
、
、
有没有办法强制
Tesseract
只做OCR而保持原始
图像
不变?目前,我使用以下命令:以便从
多
页
tif文件中产生file.pdf。我对这个命令
的
问题是
Tesseract
会修改
图像
。例如,表示表格或某些图形
的
细线将被删除。我想停止这种行为,只对文本位于原始
图像
上
的
文档进行OCR。如果重要的话, $
tesseract</em
浏览 4
提问于2015-06-15
得票数 1
1
回答
不同
图像
格式
的
Tesseract
-火车,而不是用于初级OCR
的
正如在这个上讨论
的
那样,
tesseract
对.png文件
的
操作通常比对.tiff文件
的
操作要好。(我也亲身经历过)。不幸
的
是,能够
处理
.png文件
的
盒子编辑器较少。因此,我很想用.tiff文件来训练我
的
数据,然后在我
的
主要OCR工作中使用.png文件。这样做会否降低训练
的
成效?如果是这样的话,是否有任何方法来解决这个问题(除了找到一个可以接受.png文件
的
框编辑器)?
浏览 3
提问于2016-06-23
得票数 0
回答已采纳
1
回答
带有NDK
的
Android
Tesseract
OCR (c++)
、
、
、
、
所以我有一些c++代码,它使用
tesseract
OCR,现在我不想把它移到Android上,因为它与使用openCV
的
代码连接,而我在C++中也有。 非常感谢您
的
建议和链接,以及如何使用
和
构建它。
浏览 6
提问于2015-12-08
得票数 1
回答已采纳
1
回答
tesseract
ocr
多
页
pdf挂起
、
、
、
我们正在使用
Tesseract
的
名为Tess4j
的
Java库来将PDF文件转换为文本。它可以很好地
处理
Tiff文件以及
单
页
PDF文件。但是对于
多
页
PDF,它确实会生成输出文件,当它到达最后一
页
时,控件似乎不会返回到调用doOCR调用
的
原始应用程序。它只是停留在那里/挂在那里,什么也不做。是不是本机调用没有返回
的
问题。
浏览 0
提问于2011-07-12
得票数 0
回答已采纳
2
回答
Tesserocr没有识别文本
、
我想就如何解决从
图像
中看不出某一条线
的
问题征求意见。结果是这样
的
0, text:它没有识别方框3中
的
数字我应该添加或修改脚本,这样方框3才能显示<e
浏览 8
提问于2017-03-29
得票数 0
回答已采纳
1
回答
Tesseract
-我应该如何
处理
多字体类型?
、
、
、
我有这样
的
文件输入(只有数字,但多字体类型)。所以如果我想用
Tesseract
来训练数据。我应该在一个tiff文件中设置一个字体类型,还是在一个tiff文件中设置一个多字体类型? 有什么更好
的
,请给我一些提示。谢谢你
的
帮助。
浏览 3
提问于2013-03-19
得票数 0
1
回答
如何在javax.print文档(pdf、文档、文档...)中覆盖/插入自定义文本?
、
、
我打印文档(pdf,doc,docx...)通过javax.print,它工作得很好,但我需要在文档中
的
任何位置添加一个自定义覆盖文本;该文本是从我
的
代码向文档插入打印引用所必需
的
。 我该怎么做呢?
浏览 1
提问于2015-08-22
得票数 3
4
回答
基于虚拟环境
的
AWS Lambda上
的
Tesseract
OCR
、
、
、
、
我花了整整一周
的
时间来尝试,所以这有点像冰雹玛丽。 执行pip install py-
tesseract
但是,我不
浏览 10
提问于2015-11-07
得票数 22
回答已采纳
1
回答
通过从
图像
中查找文本
的
坐标来提取文本区域
、
我正在开发一个
图像
处理
软件,提取/裁剪
和
增强这个裁剪
的
单
页
表单从一个
图像
从手机camera.The表单没有矩形
的
边界,以简化extraction.Yes
的
过程它是一个白色背景黑色文本格式,但没有什么除此之外是fixed.Now,一些文本将存在,这将验证该
图像
是required.So
的
形式,我
的
问题是这些。1)我是否可以使用
leptonica
库本身来搜索特
浏览 1
提问于2014-07-15
得票数 0
1
回答
MiniMagick (+Rails):如何显示
图像
中
的
场景数量
、
、
、
我有一个Rails应用程序,可以上传
图像
进行
图像
处理
,我希望能够1)查看
图像
中有多少
页
/帧/场景,以及2)将
多
页
图像
拆分为
单
页
jpeg。我可以毫不费力地将
图像
类型转换为
单
场景
图像
,但是我不能完全理解ImageMagick文档来理解我要做什么。我正在使用
的
文档页面如下: def mul
浏览 2
提问于2012-07-09
得票数 0
回答已采纳
1
回答
在Java中获取TIFF
图像
的
像素值
、
、
、
ImageIO包不能
处理
.tif
图像
,我也不能从.tif文件创建BufferedImage (我比较熟悉
的
类)。谢谢!
浏览 4
提问于2011-09-15
得票数 2
回答已采纳
2
回答
NSBitmapImageRep
和
多
页
TIFF
、
、
我有一个可以打开TIFF文档并显示它们
的
程序。我使用
的
是setFlipped:是。如果我只
处理
单
页
图像
文件,我可以而且,除了视图被翻转之外,似乎还可以
正确
地绘制
图像
。但是,由于某些原因,设置
图像
的
翻转似乎不会影响各个表示
的
翻转。 这是相关
的
,因为
多
页
TIFF
的
多个
图像<
浏览 8
提问于2009-08-20
得票数 0
回答已采纳
3
回答
tesseract
3.00是多线程
的
吗?
、
除了多线程之外,运行多个进程
的
tesseract
是实现并发
的
可行选择吗? 谢谢。
浏览 6
提问于2011-02-11
得票数 9
回答已采纳
1
回答
基于
Tesseract
的
鸡蛋标记识别
图像
预
处理
、
、
、
目标是开发一个能够识别鸡蛋标记
的
应用程序,例如0-DE-134461。我在下面的
图像
上尝试了
和
。两个OCR引擎
的
结果都是灾难性
的
。
tesseract</em
浏览 1
提问于2017-08-31
得票数 8
3
回答
如何用PHP将多个
单
页
TIFF合并成一个PDF?
、
、
、
、
我有大量
的
TIFF
图像
,它们是
单
次扫描
的
页面。它们每个都是一
页
多
页
的
文档。c:\images\
浏览 3
提问于2011-04-06
得票数 0
回答已采纳
1
回答
C++ -对
Tesseract
的
失望表现
、
、
、
为了获得一些性能基准(执行速度
和
准确性)来比较两者,我得到了一个非常简单
的
程序工作,仅仅是为了了解
Tesseract
3.2CAPI
的
性能。(
Tesseract
使用
的
图像
库)。虽然这确实为迁移增加了少量
的
开发开销(因为它不是开箱即用
的
),但这并不是什么问题,因为我们
的
产品中已经有模块可以从PDF文件中提取
图像
。我不是以
正确
的
方式
使用API,也不是
浏览 1
提问于2013-07-11
得票数 9
回答已采纳
1
回答
处理
一个tif文件文件夹以创建可搜索
的
PDF文件。
、
、
、
、
每个卷有近500张
图像
,如下所示: 使用ScanTailor高级
处理
每个滚动,以便裁剪
图像
,分离奇数页
和
偶数页,为每个页面添加
页
边距,并输出tiff文件,得到以下结果所以你可以想象选择每4
页
的
每一份报纸版本,并进行手工
处理
.那么,如何告诉automator接收每4(或n)个文件并与它们一起执行转换命令?,并不是所有的报纸每个版本都有4
页
,所以最好
的
解决方案是问用户有多少
页
浏览 1
提问于2020-03-09
得票数 0
2
回答
如何OCR电子邮件地址
、
、
、
、
我正在尝试OCR
和
提取
图像
中
的
电子邮件。
图像
应该有一行文本,即电子邮件地址。 我使用EmguCV.OCR从这些
图像
中提取文本(电子邮件地址)。我们
的
目标是获得100%准确
的
结果。我们可以固定文本
的
字体
和
大小。例如Ariel,12pt,这样所有的
图像
都会有用Ariel 12pt写
的
电子邮件,在白色背景上是黑色
的
。问题是EmguCV中
的
Tesseract</e
浏览 0
提问于2014-10-30
得票数 1
1
回答
NodeJS子进程在SIGINT上终止
、
、
、
我正在创建NodeJS应用程序,这会创建相当
多
的
子进程。它们由spawn
和
exec (基于lib实现)启动。一些例子可以是用于
图像
处理
的
GraphicsMagick (gm)或用于OCR
的
Tesseract
(node-
tesseract
)。所有“本地”(gm,
tesseract
,.)当时运行
的
进程也会被终止。异常消息仅由“命令失败”
和
“失败
的
命令内容”组成。OC
浏览 6
提问于2016-11-24
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用Python建一个OCR服务器,直接提取图中的文本
使用Python和Tesseract来识别图形验证码
代码分享:使用Python和Tesseract来识别图形验证码
图像识别不再难,一个用Python实现办公神器的实用教程!
Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券