Tesseract/Leptonica处理单页和多页图像的正确方式？

、、、

我有一些关于在Tesseract (使用leptonica)中如何处理输入图像的问题。我在这里尝试做的是有一个方法，可以处理任何图像文件(不需要特定的格式)，并在稍后将其提供给tesseract API，但这似乎不是使用leptonica的正确方式……string但不是我想要的<e

浏览 12提问于2018-07-20得票数 0

回答已采纳

1回答

在生成PDF时，Tesseract能否设置为仅OCR (无图像修改)？

、、

有没有办法强制Tesseract只做OCR而保持原始图像不变？目前，我使用以下命令：以便从多页tif文件中产生file.pdf。我对这个命令的问题是Tesseract会修改图像。例如，表示表格或某些图形的细线将被删除。我想停止这种行为，只对文本位于原始图像上的文档进行OCR。如果重要的话， $ tesseract</em

浏览 4提问于2015-06-15得票数 1

1回答

不同图像格式的Tesseract* -火车，而不是用于初级OCR的*

正如在这个上讨论的那样，tesseract对.png文件的操作通常比对.tiff文件的操作要好。(我也亲身经历过)。不幸的是，能够处理.png文件的盒子编辑器较少。因此，我很想用.tiff文件来训练我的数据，然后在我的主要OCR工作中使用.png文件。这样做会否降低训练的成效？如果是这样的话，是否有任何方法来解决这个问题(除了找到一个可以接受.png文件的框编辑器)？

浏览 3提问于2016-06-23得票数 0

回答已采纳

1回答

带有NDK的Android Tesseract* OCR (c++)*

、、、、

所以我有一些c++代码，它使用tesseract OCR，现在我不想把它移到Android上，因为它与使用openCV的代码连接，而我在C++中也有。非常感谢您的建议和链接，以及如何使用和构建它。

浏览 6提问于2015-12-08得票数 1

回答已采纳

1回答

tesseract ocr多页pdf挂起

、、、

我们正在使用Tesseract的名为Tess4j的Java库来将PDF文件转换为文本。它可以很好地处理Tiff文件以及单页PDF文件。但是对于多页PDF，它确实会生成输出文件，当它到达最后一页时，控件似乎不会返回到调用doOCR调用的原始应用程序。它只是停留在那里/挂在那里，什么也不做。是不是本机调用没有返回的问题。

浏览 0提问于2011-07-12得票数 0

回答已采纳

2回答

Tesserocr没有识别文本

、

我想就如何解决从图像中看不出某一条线的问题征求意见。结果是这样的0, text:它没有识别方框3中的数字我应该添加或修改脚本，这样方框3才能显示<e

浏览 8提问于2017-03-29得票数 0

回答已采纳

1回答

Tesseract -我应该如何处理多字体类型？

、、、

我有这样的文件输入(只有数字，但多字体类型)。所以如果我想用Tesseract来训练数据。我应该在一个tiff文件中设置一个字体类型，还是在一个tiff文件中设置一个多字体类型？有什么更好的，请给我一些提示。谢谢你的帮助。

浏览 3提问于2013-03-19得票数 0

1回答

如何在javax.print文档(pdf、文档、文档...)中覆盖/插入自定义文本？

、、

我打印文档(pdf，doc，docx...)通过javax.print，它工作得很好，但我需要在文档中的任何位置添加一个自定义覆盖文本；该文本是从我的代码向文档插入打印引用所必需的。我该怎么做呢？

浏览 1提问于2015-08-22得票数 3

4回答

基于虚拟环境的AWS Lambda上的Tesseract* OCR*

、、、、

我花了整整一周的时间来尝试，所以这有点像冰雹玛丽。执行pip install py-tesseract但是，我不

浏览 10提问于2015-11-07得票数 22

回答已采纳

1回答

通过从图像中查找文本的坐标来提取文本区域

、

我正在开发一个图像处理软件，提取/裁剪和增强这个裁剪的单页表单从一个图像从手机camera.The表单没有矩形的边界，以简化extraction.Yes的过程它是一个白色背景黑色文本格式，但没有什么除此之外是fixed.Now，一些文本将存在，这将验证该图像是required.So的形式，我的问题是这些。1)我是否可以使用leptonica库本身来搜索特

浏览 1提问于2014-07-15得票数 0

1回答

MiniMagick (+Rails)：如何显示图像中的场景数量

、、、

我有一个Rails应用程序，可以上传图像进行图像处理，我希望能够1)查看图像中有多少页/帧/场景，以及2)将多页图像拆分为单页jpeg。我可以毫不费力地将图像类型转换为单场景图像，但是我不能完全理解ImageMagick文档来理解我要做什么。我正在使用的文档页面如下： def mul

浏览 2提问于2012-07-09得票数 0

回答已采纳

1回答

在Java中获取TIFF图像的像素值

、、、

ImageIO包不能处理.tif图像，我也不能从.tif文件创建BufferedImage (我比较熟悉的类)。谢谢!

浏览 4提问于2011-09-15得票数 2

回答已采纳

2回答

NSBitmapImageRep和多页TIFF

、、

我有一个可以打开TIFF文档并显示它们的程序。我使用的是setFlipped:是。如果我只处理单页图像文件，我可以而且，除了视图被翻转之外，似乎还可以正确地绘制图像。但是，由于某些原因，设置图像的翻转似乎不会影响各个表示的翻转。这是相关的，因为多页TIFF的多个图像<

浏览 8提问于2009-08-20得票数 0

回答已采纳

3回答

tesseract 3.00是多线程的吗？

、

除了多线程之外，运行多个进程的tesseract是实现并发的可行选择吗？谢谢。

浏览 6提问于2011-02-11得票数 9

回答已采纳

1回答

基于Tesseract的鸡蛋标记识别图像预处理

、、、

目标是开发一个能够识别鸡蛋标记的应用程序，例如0-DE-134461。我在下面的图像上尝试了和。两个OCR引擎的结果都是灾难性的。 tesseract</em

浏览 1提问于2017-08-31得票数 8

3回答

如何用PHP将多个单页TIFF合并成一个PDF？

、、、、

我有大量的TIFF图像，它们是单次扫描的页面。它们每个都是一页多页的文档。c:\images\

浏览 3提问于2011-04-06得票数 0

回答已采纳

1回答

C++ -对Tesseract的失望表现

、、、

为了获得一些性能基准(执行速度和准确性)来比较两者，我得到了一个非常简单的程序工作，仅仅是为了了解Tesseract 3.2CAPI的性能。(Tesseract使用的图像库)。虽然这确实为迁移增加了少量的开发开销(因为它不是开箱即用的)，但这并不是什么问题，因为我们的产品中已经有模块可以从PDF文件中提取图像。我不是以正确的方式使用API，也不是

浏览 1提问于2013-07-11得票数 9

回答已采纳

1回答

处理一个tif文件文件夹以创建可搜索的PDF文件。

、、、、

每个卷有近500张图像，如下所示：使用ScanTailor高级处理每个滚动，以便裁剪图像，分离奇数页和偶数页，为每个页面添加页边距，并输出tiff文件，得到以下结果所以你可以想象选择每4页的每一份报纸版本，并进行手工处理.那么，如何告诉automator接收每4(或n)个文件并与它们一起执行转换命令？，并不是所有的报纸每个版本都有4页，所以最好的解决方案是问用户有多少页

浏览 1提问于2020-03-09得票数 0

2回答

如何OCR电子邮件地址

、、、、

我正在尝试OCR和提取图像中的电子邮件。图像应该有一行文本，即电子邮件地址。我使用EmguCV.OCR从这些图像中提取文本(电子邮件地址)。我们的目标是获得100%准确的结果。我们可以固定文本的字体和大小。例如Ariel，12pt，这样所有的图像都会有用Ariel 12pt写的电子邮件，在白色背景上是黑色的。问题是EmguCV中的Tesseract</e

浏览 0提问于2014-10-30得票数 1

1回答

NodeJS子进程在SIGINT上终止

、、、

我正在创建NodeJS应用程序，这会创建相当多的子进程。它们由spawn和exec (基于lib实现)启动。一些例子可以是用于图像处理的GraphicsMagick (gm)或用于OCR的Tesseract (node-tesseract)。所有“本地”(gm，tesseract，.)当时运行的进程也会被终止。异常消息仅由“命令失败”和“失败的命令内容”组成。OC

浏览 6提问于2016-11-24得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在生成PDF时，Tesseract能否设置为仅OCR (无图像修改)？

不同图像格式的Tesseract* -火车，而不是用于初级OCR的*

带有NDK的Android Tesseract* OCR (c++)*

tesseract ocr多页pdf挂起

Tesserocr没有识别文本

Tesseract -我应该如何处理多字体类型？

如何在javax.print文档(pdf、文档、文档...)中覆盖/插入自定义文本？

基于虚拟环境的AWS Lambda上的Tesseract* OCR*

通过从图像中查找文本的坐标来提取文本区域

MiniMagick (+Rails)：如何显示图像中的场景数量

在Java中获取TIFF图像的像素值

NSBitmapImageRep和多页TIFF

tesseract 3.00是多线程的吗？

基于Tesseract的鸡蛋标记识别图像预处理

如何用PHP将多个单页TIFF合并成一个PDF？

C++ -对Tesseract的失望表现

处理一个tif文件文件夹以创建可搜索的PDF文件。

如何OCR电子邮件地址

NodeJS子进程在SIGINT上终止

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐