ocr算法_js ocr 算法_ocr 算法原理 - 腾讯云开发者社区

、、

我正在工作的一个项目，需要准确的OCR结果的图像丰富的背景。因此，我比较两个OCR(其中之一是Tesseract)的结果，以作出我的选择。重点是预处理步骤，特别是图像二值化对结果有很大影响。我提取了其他OCR的二值化图像，并将其传递给Tesseract，使Tesseract的结果提高了30-40%。我有两个问题，你的回答对我有很大帮助： tesseract使用什么二值化算法，它是否可配置？有没有办法提取Tesseract OCR的二值化图像，这样我就可以用它来测试其他OCR了吗？ (预先谢谢:)

浏览 6提问于2015-03-31得票数 6

回答已采纳

1回答

如何使用OCR从jpg文件中提取数值

、、、

我创建了以下代码并执行： Ocr.setUp(); Ocr ocr = new Ocr(); ocr.startEngine("eng", Ocr.SPEED_FASTEST); String s = ocr.recognize(theImage, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PLAINTEXT); ocr.stopEngine(); Output: Result: L‘i L‘L’Ui l 实际上，图像只包含数字值。是否可以使用上述代码仅提取数字值？我在jpg文件中显示了1234个数值，我只想在o/p控制台中打印这个

浏览 2提问于2015-11-25得票数 0

回答已采纳

1回答

Java -通过图像识别一个字符

、、、

我试图使用Ocr框架来识别这些类型的图像:这些是两个字母G。我试过使用aocr.jar，但这段代码似乎做不到。 import com.asprise.ocr.Ocr; import java.io.File; public class textRecognizer { public static void main(String args[]){ Ocr.setUp(); Ocr ocr = new Ocr(); ocr.startEngine("eng", Ocr.SPEED_FAST);

浏览 2提问于2014-09-09得票数 2

2回答

OCR的字距算法

、、、

我正在使用OCR输出，并在其中搜索特殊的单词。由于输出不干净，我根据低于特定阈值的字距查找与输入匹配的元素。然而，我认为Levenshtein距离或Hamming距离并不是最好的方法，因为OCR似乎总是犯同样的错误:I表示1，0表示O，Q表示O。例如，这些“经典”错误似乎不如"A for K“那么重要。因此，这些距离并不关心字符外观的差异(低/高)。是否有专门为OCR设计的字距算法，我可以使用它更适合我的情况？还是应该根据文字的视觉差异来实现我的自定义单词距离呢？

浏览 6提问于2014-03-31得票数 4

回答已采纳

2回答

如何获得正则表达式的最近匹配

、

我有一个使用正则表达式从文本(format =mm)中提取日期的代码。备注：文本是在票据图像上使用OCR获取的。因此，预期的日期格式是，但是它可以是任何随机文本，因为它是使用OCR获得的。 import re date_reg_exp = re.compile('\d{2}[-/.]\d{2}[-/.]\d{4}') #works for mm-dd-yyyy matches_list=date_reg_exp.findall(test_str) for match in matches_list2: print match 如果我有一个字符串'This is a

浏览 7提问于2015-12-04得票数 2

1回答

OCR算法-区分文本图像和对象图像

我正在写一个程序，从不同网站的徽标中提取内容。我正在使用OCR从徽标中提取文本，但我想优化程序，只想在那些有文字但我不知道如何确定徽标是否包含文本的徽标上应用OCR？有什么方法吗？？

浏览 2提问于2012-06-21得票数 4

1回答

基于OCR的BarCode识别

、、、、

我试图用简单的CNN识别条形码，把它当作一个多位数识别问题。结果不是很好。所以我也在寻找一些更好的深造模式。在我的搜索过程中，我没有发现在条形码上试用任何OCR型号。所以我的问题是-可以训练OCR模型识别条形码。我发现条形码的检测和识别任务与文本识别非常相似。我遗漏了什么吗？

浏览 3提问于2020-05-09得票数 1

回答已采纳

2回答

开放源码中文OCR

、、、

我到处寻找开放源码的OCR，寻找中文。但如果没有任何运气，似乎很少有一些开放源码的OCR (为中文)是可用的。所以我在这里想： environment?What's是否有用于制作的开放源码？对于拉丁文和中文实现OCR的主要区别是？我知道一些好的OCR，如Tesseract或Ocropus，如果我想让它支持中文，我该怎么办？如有任何帮助，请提前表示感谢。

浏览 3提问于2009-12-15得票数 9

回答已采纳

1回答

从图像Paddleocr提取边界框

、、、

我使用此代码检测所有文本并绘制所有采购框： from paddleocr import PaddleOCR,draw_ocr ocr = PaddleOCR(lang='en') # need to run only once to download and load model into memory img_path = 'PaddleOCR/doc/imgs_en/img_12.jpg' result = ocr.ocr(img_path, cls=False) for line in result: print(line) # draw res

浏览 1提问于2022-07-02得票数 1

1回答

OCR最小字符大小

、、

我正在计划一个相机的属性，我需要一个计算机视觉系统。我必须检测图像中的一些字母数字区域，然后使用Tesseract和OpenCV将它们与OCR进行转换。一个典型的例子可能是高速公路上的车牌识别(但在我的项目中，速度是没有问题的)。为了估计相机的分辨率，我需要知道镜头的距离和焦距，这可能是文本像素中的最小高度，以获得可靠的OCR转换。利用薄透镜方程，得到了文本高度( mm )与文本高度(像素)之间的关系。改变相机的距离或焦距，我得到不同的高度在我的文字像素(从10像素到40像素) 当然，我更喜欢字符高度为40像素，但这也是最昂贵的解决方案。出于这个原因，我想知道OpenCV和Tessera

浏览 7提问于2014-12-15得票数 4

回答已采纳

1回答

基于贝叶斯分类的数字识别

、

我只需要为数字写一个OCR程序。我将使用MNIST数据集。问题是我不知道从哪里开始。有很多论文并没有真正解释算法。我对模式识别并不是很了解。所以我有几个问题。 Q1 :在哪里可以找到算法(或教程) Q2 :如何对数字进行分类？我不需要非常高级的东西。我首先想到的是找出上半部分/下半部分和左侧/右侧的比例。有没有更有用和更简单的分类方法。Q3 :什么是反向传播和层，这在大多数论文中都有介绍。我的简单的OCR需要它们吗？注意:我知道我的OCR程序不会准确。就目前而言，这并不重要。

浏览 0提问于2011-11-18得票数 6

回答已采纳

2回答

如何检测巨蟒图像的亮度和清晰度？

、、、

我尝试在图像上应用tesseract ocr，但在应用OCR之前，我希望提高图像的质量，从而提高OCR的效率。如何根据需要检测图像亮度，，增加或降低图像亮度。如何检测图像锐度

浏览 1提问于2020-01-08得票数 1

1回答

模式( regex )与找到的值之间的相似性

、、、

我有一个包含文字信息的图像，并且：我从中提取/裁剪一幅小图像。我正在使用OCR从小图像中提取文本。检查提取的值是否与模式匹配(浮点、日期.)如果是这样我将值存储在数据库中。问题是:有时ocr提取一个包含一些符号的值，因此它与模式示例不匹配:对于模式日期： pattern = "(0[1-9]|[12][0-9]|3[01])/(0[1-9]|1[012])/(19|20)\d\d" 图像的值是 12/02/2014 但OCR提取： 12? /02 -2014 我想得到模式和提取的值之间的相似性(最近处理它)，有什么方法可以做到这一点而不改变模式

浏览 2提问于2014-05-13得票数 5

回答已采纳

1回答

如何使用从信用卡图像中提取细节？

、、

我想使用opencv-python来执行信用卡OCR。这是怎么做到的？

浏览 0提问于2018-08-21得票数 0

1回答

如何使用人工智能开发光学字符识别器？

、、

我已经开发了一种OCR，它完全致力于字体和大小。我只是用来计算字体的高度和宽度，找出我与数据库值比较的比率，然后选择字体。我想将逻辑扩展到所有类型的字体和大小。我想用人工智能来做。我看过一些开源OCR的编码。但是，它不会有什么用处。请指导我应该遵循/开始开发我自己的OCR的方法。我想让它成为一个全世界的Oper Source项目，也想为Java中进一步的项目具体开发提供API。提前谢谢。

浏览 1提问于2012-04-30得票数 4

回答已采纳

2回答

计算OCR精度

、、、

我需要计算OCR字符的准确性。样地值： Non sinking ship is friendship 示例ocr值输入 non singing ship is finedship 令人关切的领域是：遗漏字符额外字符错位字符字符准确性是由实际字符的数量定义的，其位置除以实际字符的总数。我需要一个python脚本来找到这种准确性。我的初步实施如下： ground_value = "Non sinking ship is friendship" ocr_value = "non singing ship is finedship" gr

浏览 5提问于2020-08-22得票数 2

回答已采纳

1回答

如何使用OpenCV和Tesseract正确检测图像中的单词

、、

我正在开发一个应用程序，它使用OpenCV读取图像文件，并使用Tesseract处理其中的单词。使用以下代码，Tesseract会检测不包含文本的额外矩形。 void Application::Application::OpenAndProcessImageFile(void) { OPENFILENAMEA ofn; ZeroMemory(&ofn, sizeof(OPENFILENAMEA)); char szFile[260] = { 0 }; // Initialize remaining fields of OPENFILENAMEA st

浏览 73提问于2021-11-18得票数 0

回答已采纳

2回答

去除文档图像中的噪声

、、、

我正在做一个自动处理扫描发票的项目。为了在OCR引擎上获得更好的效果，我想首先去除图像中的噪声。除了划痕之外，我还想删除打印后添加到文档中的任何内容。例如，许多发票都打了勾，有时这会使OCR无法读取发票的某些部分。例如，看一看图像。第二个项目的描述将是不可读的，我想删除这样的“噪音”。那么，我如何才能移除这样的手写区域，同时仍然保持下面打印文本的高质量呢？

浏览 0提问于2011-11-17得票数 6

回答已采纳

3回答

Vuforia文本识别与OCR的区别？

、、、、

谁能告诉我Vuforia文本识别和OCR的区别是什么？是一样的吗？我有点困惑，因为我发现Vuforia不需要捕获任何图像就可以识别文本，而OCR应用程序(如Tesseract )则要求用户捕获文本，图像识别文本。谢谢。

浏览 1提问于2013-11-03得票数 1

回答已采纳

1回答

使用Tesseract OCR和tess-2的垃圾结果

、、、

我已经开发了使用Tesseract OCR库的OCR应用程序，并参考了以下链接。但我有时会得到垃圾数据作为结果。有人能帮我做些什么才能得到准确的结果吗？

浏览 1提问于2016-08-31得票数 0

1回答

混贴票据识别全电发票发票编号识别为19位？

、、

通过混贴票据识别进行三张全电发票ocr识别，发票编号总是少个0，20位识别为19位，请问是不是个例？

浏览 183提问于2022-08-31

10回答

OpenCV检测号码

、、

我在iPhone上使用iPhone，需要检测图像中的数字。我将图像分割成较小的图像，因此每个图像只有一个数字(1-9)。所有的数字都是打印出来的，不是手写的。用OpenCV计算数字的最佳方法是什么？更新：我已经成功地找到了数字并提取了它们。它们看起来是这样的：当它们被提取时，它们大小相同，依此类推。我保存了一堆图像，并将它们放在OCR dir中，在那里它们被分类为数字。类似: ocr/1/100.jpg 101.jpg.和ocr/2/200.jpg 201.jpg. 然后，我将使用与基本OCR教程中相同的方法：但是，我正在为iPhone编程，不能使用C++代码(编译错误等等)，也

浏览 10提问于2011-05-03得票数 20

2回答

电子发票（增值税专用发票）识别失败？

、、

图片 ocr仅能识别价税合计正确，开票日期，发票号码，皆识别失败

浏览 559提问于2022-08-24

2回答

如何根据用户文本输入从列表中选择最可能的选项

、、

我正在处理一个OCR应用程序，在那里我需要根据用户文本输入选择一个选项。 Ex: Available Options: ["python", "ruby", "java", "clojure", "haskell"] Input: kava Output: java Input: ruby Output: ruby Input: clujuro Output: clojure etc.. 我的应用程序是基于python的，有没有解决这个问题的算法？

浏览 0提问于2011-08-08得票数 11

回答已采纳

1回答

Tesseract OCR:获取文本和弦并提高最终OCR视频帧的质量

、、、

我正在使用tesseract OCR来识别视频帧的文本。我编写了一个程序，使用ffmpeg获取视频的所有主要帧，并对它们进行裁剪(用静态值)作为文本的中心(例如，它应该是字幕)。我还使用了ImageMagick和TextCleaner脚本，它们像魔法一样提高了OCR的质量！不管怎么说，有时候我的视频质量不太好，或者视频大小有点小，或者裁剪没有中间的文本(因为值是staitc)，而OCR的结果非常糟糕。我的问题是:如何才能检测到文本的正确位置？这将提高OCR的质量，取得更好的效果。如有任何建议，将不胜感激。谢谢。

浏览 2提问于2014-12-04得票数 1

1回答

有人能在这张图像上成功地执行OCR吗？

、、、、

我试过从网上下载一些演示来测试这个图像上的OCR，图像上的字符不是很好的打印字符，当你输入一个TextBox时你可以看到。我对OCR和神经网络没有足够的经验。这是我的照片和我有一些问题要问：我是否需要用这些新的非标准字符重新训练神经网络，网络已经使用标准字符集进行了训练。(我的意思是，在TextBox中输入任何指定字体的字符时，标准字符看起来就像您看到的字符)。你能用一些例子对我上传的图像执行OCR吗？如果可以的话，请给我那个工作的例子？您的帮助将不胜感激！

浏览 2提问于2013-06-23得票数 1

1回答

PHP形状/图案识别内部图像

、、

我想得到一些提示/片段，如何在PHP的帮助下识别图片中的所需形状/图案。我想要裁剪包含身份证的图像的固定区域(使用百分比)，但要做到这一点，首先我必须检测身份证的边界并裁剪图像，以便除了卡片外，图像中将没有任何剩余。图片中的身份证不会旋转(不超过几度)，背景可能会有所不同。我的最终目标是使用OCR的裁剪区域。我认为，这种方法将很好地删除不需要的部分，也有助于OCR。如果你有更好的主意，告诉我。

浏览 0提问于2014-08-26得票数 2

1回答

使用OpenCV捕获图像的特定位置

、、

我正在尝试以数字方式组织我的交易卡收藏，并致力于建立一个扫描仪，使用ocr来检测我收藏的名称。我需要使用网络摄像头来捕捉每个有问题的卡的单个图像。拍摄图像似乎并不困难，但我需要帮助确定如何让OpenCV只捕获该图像的特定部分。我试图只捕捉图像的文本部分，这样卡片上的图片就不会干扰OCR。如果我的卡片每次都被放置在相同的物理位置，有没有办法让OpenCV拍摄一张图像，并只关注我感兴趣的图像区域。谢谢酸插孔

浏览 2提问于2015-05-10得票数 1

1回答

是否有可以计数对象的OCR？

、、

是否有一个OCR可用于从图像中识别和计数对象？或者可以用另一种图像处理技术来实现这一点？例如，如果我特写三个盒子的照片，API只会返回数字3作为结果。

浏览 3提问于2013-10-28得票数 0

3回答

C#检查是否包含各种子字符串组合

、、、

我想检查我的OCR结果(字符串)是"No Edge“还是"No Signal”。问题是有时我会得到N0 Edge，No Signa1，N0 signa1，No 5ignal等。字母o，S，i和l有时会变成数字或其他东西。不幸的是，对于OCR，我无能为力。目前，我正在这样做： ocrResult = ocrResult.ToLower(); if (ocrResult.Contains("edg") || ocrResult.Contains("gna")) { //no edge or no signal } else {

浏览 1提问于2015-11-04得票数 2

回答已采纳

1回答

C#在图像中查找边界区域

、

我正在为我的一个类编写一个OCR程序，我试图在文本中找到圆形闭合区域来对字符进行分类。单词已经被简化了。例如，在此图像中：我想要找到圆形O的位置，甚至是E中的半圆。我试图将像素转换为数组，然后循环遍历所有的白色像素，找到封闭的路径，但这不起作用。然而，我可能没有正确地实现这一点。还有其他的解决方案吗？提前谢谢。编辑：不幸的是，我不能使用Tesseract或其他OCR程序，因为我必须为我的大学课程开发自己的程序。我已经使用AForge库做了很多任务，比如骨架化，我想在那里使用圆检测或形状检测类，但这些形状太迟钝了，无法使用它们。

浏览 1提问于2012-11-16得票数 2

1回答

如何在PDF中检测可视块？

、

我在试着写OCR简历。我的第一个问题是，在OCR之前，获取文档的主要块。由于所有的简历都有“视觉模块”(指的是专业经验、技能、语言、爱好等等)，我想知道是否有任何开源解决方案可以将文档“拆分”成“模块”，显然与布局设计无关(我想这就是某种人工智能将工作的地方) 谢谢

浏览 9提问于2019-02-24得票数 0

1回答

如何连接2个等高线

、

我正在尝试构建一个ocr/ocv应用程序。效果很好。但在现实生活中，印刷文本并不是完美的，它有一些缺陷，如油墨的铺展或介于两者之间。Inkspread是可管理的，但是当有一个切分时，我仍然坚持如何加入字符的两个部分，如下面的图像：我在做ocr/ocv之前找到轮廓，： using (VectorOfVectorOfPoint contours = new VectorOfVectorOfPoint()) { CvInvoke.FindContours(binaryimg, contours, null, RetrType.Ex

浏览 8提问于2022-06-27得票数 0

2回答

为什么Tesseract OCR使用Otsu二值化？

、、

为什么Tesseract OCR引擎使用全局阈值技术，如Otsu二值化？不是局部阈值技术(例如Sauvola、Niblack等)更有效地从图像中删除文本？

浏览 16提问于2019-06-24得票数 4

回答已采纳

1回答

openCV - anpr系统。提高成功率

、、

我正在尝试写一个非常好的ANPR (自动车牌识别)系统为巴西的汽车牌照。到目前为止，我已经使用了javaANPR方法，即X和Y投影来找到感兴趣区域(车牌)。它工作得很好，但对车内有很多阴影的图像效果不是很好。我也在使用tesseract-ocr进行字符识别。我获得了80%的成功是因为非常好的汽车图像，因为汽车不动。而我得到的不到60%，因为移动的汽车图像不是很好。我一直在网上寻找资源，阅读论文等。你认为什么可以帮助我改进它？也许可以使用两种方法？也使用templateMatch吗？因为我需要95% - 98%的成功率。我在网上看到了他们的演示：他们真的做得很好。它对我所有的图像都有效

浏览 0提问于2013-11-23得票数 0

1回答

Atmega2560设置脉宽调制和正边沿中断

、、、

我正试着在同一个定时器上做两个操作: PWM和正边沿中断。我可以让它们单独工作，但似乎不能让它们一起工作。我在Arduino板上使用atmega2560芯片，并尝试在Timer1上实现，这是执行脉宽调制的代码： TCCR1A = 0; TCCR1B = 0; TCCR1A |= (1<<WGM11)|(1<<COM1A1)|(1<<COM1B1); TCCR1B |= (1<<WGM12)|(1<<WGM13)|(1<<CS10); ICR1 = 29999; OCR1A = 0; OCR1B = 0; ICR1将频率设置

浏览 0提问于2015-04-02得票数 0

3回答

计算机视觉

、

我对计算机视觉很陌生。我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python <3版本兼容。任何关于如何进行和获取相关代码和好文件的想法。注意:我已经实现了pytesseract-OCR，而且没有取得好的效果。

浏览 8提问于2018-05-28得票数 1

回答已采纳

1回答

对于64位Windows操作系统和32位Ubuntu操作系统，Tesseract解码结果不同

、、、

我正在测试相同的图像附加到解码数字使用tesseract。我在64位Windows操作系统和32位Ubuntu操作系统上进行了测试。Windows操作系统中的测试结果给出了正确的结果。Windows的结果是43750，但是32位的Ubuntu给了我43730。我使用的代码如下所示 tesseract::TessBaseAPI tess; tess.Init("/usr/share/tesseract-ocr/tessdata/", "eng", tesseract::OEM_DEFAULT); tess.SetVa

浏览 1提问于2015-07-06得票数 0

回答已采纳

3回答

文档OCR /可读性的图像处理/增强算法？

我正在寻找算法，论文，或软件，以增强传真，从手机摄像头的图像，以及其他类似来源的可读性和OCR。我主要对简单的增强功能感兴趣(例如：你可以用ImageMagick做的事情)，但我也对更复杂的技术感兴趣。我已经和供应商谈过了，所以对于这个问题，我主要是寻找算法或开源软件。进一步澄清:我不是在寻找OCR软件或算法；我是在寻找算法来清理图像，使其看起来更具人眼可读性，并可能用于OCR。

浏览 3提问于2009-04-03得票数 9

1回答

黑白图像文档聚类

、、、、

我有一些黑白文档(图像扫描)，并希望根据它们的布局对它们进行聚类。为了使事情更具体，假设我有以下三张图片，前两张更有可能落入同一个集群，而不是第三张图像，因为前两张的布局比较相似。我的问题是，对文档进行聚类的最佳方法是什么？现在我有几个初步的方法：获取图像哈希并比较哈希用主成分分析和几种聚类方法(K-均值)对低维表示进行比较。使用OCR提取字符串，提取文本特性并进行比较。使用OCR提取字符串并进行关键字搜索还有其他更好的方法吗？同样，只有布局才重要。

浏览 0提问于2017-11-23得票数 5

2回答

Java检测图像中的旋转

、、、、

我正在做一个OCR，它的主要功能是OCR发票，现在它可以发生，他们有一个(轻微)旋转时，被扫描。你有什么建议来修正旋转吗？我现在拥有的是：计算图像中“白线数量”的函数。一种能以任意角度旋转图像的函数。当前方法:每次以1度的角度旋转图像，用最白的线条检查解决方案，并将该图像用于OCR进程的其余部分。缺点:每次旋转都需要0.5秒，图像以相当高的分辨率扫描(2000宽x 3000米)，并且OCR过程绝对需要分辨率。有没有任何方法可以检测到图像中的旋转，这样我只需要做一个昂贵的旋转？致以问候。

浏览 7提问于2013-08-26得票数 1

回答已采纳

2回答

如何在将扫描的文档传递到tesserract for OCRing之前删除图形？

、

我正在处理OCR项目，但我不知道如何在将其传递给tesserract之前从扫描的文档图像中删除图形。下面是一些我想要删除图形的扫描文档：任何建议都是非常感谢的。非常感谢。

浏览 1提问于2013-10-23得票数 1

1回答

快速检查PDF文件上的OCR文本层

、

有没有什么程序可以让我在PDF渲染的基础上叠加PDF的文本(OCR)层？我想快速查看文本层是否有错误。如果这可以用程序来完成，那会更方便，如果不能，一些cli命令或脚本也可以工作。

浏览 2提问于2017-11-18得票数 1

2回答

在google的tesseract-OCR识别中使用了哪种算法？

、、

在google的tesseract中使用哪种算法--OCR进行识别?是神经网络吗？

浏览 7提问于2017-06-07得票数 5

1回答

用于iPhone应用的移动OCR引擎

、

我正在开发一个应用程序，在其中，我必须使用OCR引擎，请您帮助我选择最好的在这方面。我必须从图像中提取文本。我听说过艾比。这是最好的吗？如果还有别的选择先期

浏览 2提问于2009-11-12得票数 8

1回答

标识图像的表和表单元格

、

我试图从图像中显示的数据表中读取数据。图像示例：高分辨率图像在这里：目前，我已经能够使用opencv (C++)从图像中检测和裁剪表。为了以后执行OCR，我应该采取哪些步骤逐个裁剪表格中的单元格？

浏览 6提问于2014-04-14得票数 4

回答已采纳

1回答

图像操作库

、、、

我需要一个主要用于颜色处理的库，我想让图像变得黑白，并增强对比度，这样Tesseract (Google OCR库)就可以更好地阅读我扔给它的图像。或者如果有人对如何改进Tesseract结果有更好的想法，我完全支持。

浏览 2提问于2011-09-20得票数 1

回答已采纳

4回答

可以处理拼写错误的单词的regex

、

是否有一种方法来创建正则表达式，以确保在给定的字符范围(例如，20个字符)中有5个字符是按顺序排列的？我正在处理可怕的OCR/扫描，我可以忍受假阳性。有办法这样做吗？更新:我想要将"mshpeln“匹配为misspelling。我不想做OCR。OCR工作已经完成，但是做得很糟糕(也就是说，它最初说的是misspelling，但是OCR的拷贝是"mshpeln")。我不知道我要与之匹配的文本将是什么(即我不知道它是"mshpeln“，它可能是"mispel”或任何其他组合)。我不是试图用它作为拼写检查器，而只是找到捕获组的结尾。顺便说一句，我目前在

浏览 3提问于2013-06-04得票数 0

1回答

认知服务OCR正反

、

我正在试用ocr服务。有些文本比“正常”(字体不寻常的标识)识别得更好，有些文本根本不被识别(有些是在有非白色背景的区域)。我能做些什么来提高认知度吗？谢谢马丁

浏览 3提问于2017-05-29得票数 0

回答已采纳

1回答

如何使用边界矩形纠正OCR分割错误？

、、、

我将tesseract用于OCR，并注意到，有时会出现分割错误，“显然”属于一起的字符会被分割成单独的字符串。根据在一个文本行中发现的字符列表及其边界框，以及初步的OCR结果表明，这些字符中的哪些属于一个单词，我可以应用哪些算法来纠正分割错误或验证结果？所以这是可用的数据： List<Word> words; for(Word word : words){ for(Char c : word.getChars()){ char ch = c.getValue(); Rectangle rect = c.getRect(); } }

浏览 0提问于2012-04-18得票数 5

回答已采纳