为什么我在通过Tesseract获取文本时会得到额外的字符(箭头符号)？

文章/答案/技术大牛

发布

1回答

每当我获取任何语言的文本时，输出都会有这个额外的字符(箭头符号)，而这个字符并不在图像中。我想了解它为什么会出现，以及如何在输出中避免这些额外的字符。 ?

浏览 32提问于2021-07-05得票数 1

回答已采纳

1回答

javascript -移动文本区域插入符号时执行

、、、、

我有一个文本区域，我想要更改文本，说明插入符号(光标)之后是什么字符。<textarea id="text"></textarea>Character after the caret: <span id="char"></span> 我知道怎么找到插入符号的位置问题是我不知道

浏览 15提问于2019-01-02得票数 9

回答已采纳

1回答

如何分割图像上的连通字符，以便进行进一步的OCR？

、、、、

我正在Java (使用OpenCV库)上使用Tesseract (这种自定义字体的预培训)为OCR准备图像。有一个蓝色文本的图像，通过OpenCV inRange()方法对图像进行大小调整和二值化之后，我得到了黑白图像，但是有些字母是连在一起的，而且Tesseract有时会在它们上出错。此外，还有几个问题:原始文本很小，边框像素总是有一些不同的RGB值，背景也总是

浏览 5提问于2022-04-15得票数 0

2回答

如何使用OCR Pytesseract删除文本提取后出现的箭头符号

、、、、

嗨，我正在使用坐标从简历中提取一些文本。从OCR Pytesseract提取文本后，每次我将文本写入txt文件时，都会弹出一个箭头这是我的代码 import cv2 threading.Thread(target =skills(image)).start() 这是提取

浏览 37提问于2021-01-25得票数 1

1回答

如何使用OpenCV和Tesseract正确检测图像中的单词

、、

我正在开发一个应用程序，它使用OpenCV读取图像文件，并使用Tesseract处理其中的单词。使用以下代码，Tesseract会检测不包含文本的额外矩形。//load image tesseract::TessBaseAPI ocr = <em

浏览 73提问于2021-11-18得票数 0

回答已采纳

3回答

在任何打开的应用程序的文本字段中获取“光标之前的单词”的最佳方法

、、

我正在编写一个文本输入应用程序，它位于系统托盘中，通过键盘钩子帮助输入文本。用户键入的当前字符由以前的字母确定。如果我从头开始每个单词，这很好用，我可以在我的程序中跟踪字符串中的单词。当我将插入符号放在单词中间时，问题就出现了。我需要检测在插入符号位置之前出现的字符

浏览 1提问于2010-01-16得票数 1

回答已采纳

1回答

Tesseract返回非英文字符

、、

我最近遵循了一些教程来设置Tesseract，现在我正在尝试看看OCR是否工作正常。当我拍摄一张照片并获取文本时，有时会得到非英文字符。这实际上看起来像是胡言乱语。我已经发布了一个输出示例，如下所示： .::§—‘.::~__>‘Z~r'.‘ ,::-SES‘:3£a"3'§_“5.E.~ °?®.=_- .我拍的

浏览 0提问于2013-07-23得票数 1

1回答

是什么导致这些符号出现在文字屏幕上的擦伤？

、、、

99/100次，它很好，没有额外的文字填充或奇怪的符号，但在过去的6个月里，这已经发生了3次，我不知道为什么。有人能为我指出这些符号的正确方向吗？我的假设是，在客户端的某个地方，他们通过某种方法将数据放入其中，这种方法是在浏览器没有呈现的文本字段中放置一些未知<em

浏览 2提问于2016-06-15得票数 0

回答已采纳

1回答

Tesseract无法识别一系列随机的英语字符。

、

我正在寻找一些帮助来配置Tesseract来识别以下图像(称为token.png)中的字符：使用默认设置运行Tesseract结果：在上，建议禁用字典 load_system_dawg F然后跑 <em

浏览 0提问于2019-07-25得票数 0

1回答

使用Tesseract简单任务的OCR失败

、、

我正在对扫描的文本页面进行文本识别，最近开始尝试Tesseract。我意识到它有时会在一些任务中挣扎，所以我在一个领域中创建了一个感兴趣的区域，在那里我将不需要识别任何到两个字符，如下所示：我做了一些清理，以获得这个"C“字符，但是，在Tesseract上运行图片： $ tesseract

浏览 177提问于2020-02-23得票数 0

1回答

带气量计的电阻式OCR

、、

我正试图让Tesseract从一张气表单元的照片中识别数字。但它主要返回空页作为输出(例如，我使用Tesseract 3.02)。我想把Tesseract用于Android的OCR应用程序，所以我只是想看看Tesseract是否能够识别这样的数字。第一张照片是我在java程序中通过图像预处理所能得到的。如果我使

浏览 3提问于2013-05-03得票数 2

1回答

使用Android的Opencv

、

我想为Sindhi做OCR，在Android应用程序中，想法是让用户在屏幕上写字，然后捕获帧，然后将其与手机中预先保存的单词的图像以及最匹配的图像(使用FLANN?)进行比较。在这个框架中会有一些文本对它，我只想读那个文本。所以，请告诉我，如果我的方法是错误的，因为我对安卓和OpenCV都是新手，或者告诉我如何开始？

浏览 4提问于2015-05-09得票数 0

2回答

对Tesseract的限制预处理

、、、

我是库的新手，我在Ubuntu12.04上设置了它。预处理的步骤图像的补充，使背景变成白色，文本</e

浏览 9提问于2014-01-22得票数 0

回答已采纳

3回答

如何在iOS 9音乐应用程序中实现iOS Swift项目中的向下箭头/插入符号？

、、、、

我正在寻找创建向下箭头的最佳方法(插入符号？)在UILabel的右侧，在以UINavigationItem为中心的视图中。整个事情应该看起来像在iOS 9音乐应用程序的向下。标签的文本在运行时会发生变化，标签的标题/文本(包括箭头)应该在这个屏幕截图中居中：目前，我<

浏览 4提问于2016-02-24得票数 7

回答已采纳

1回答

OCR:如何提高现有的删除非文本“家具”、形状等库的准确性，以避免混淆OCR？

、、、

我希望删除截图图像中包含文本的矩形等，这样我就可以执行光学字符识别，从屏幕截图中获得准确的文本。我这样做是为了从遗留应用程序中提取数据，以便与其他应用程序一起使用。我已经在自动化UI方面取得了一些成功，并且能够使用tesseract从位图中获取普通的ascii文本。我在问是否有一个基于通用命令行<em

浏览 1提问于2010-03-15得票数 3

回答已采纳

1回答

如何处理二值图像以对齐一行中的稀疏字母？

、、、、

我正在尝试使用tesseract ocr将图像转换为文本。图像始终有三个字母，没有旋转/倾斜，但随机分布在一个90x50的png文件中。通过仅清理和转换为黑/白，tesseract无法获取图像中的文本。在画图中手动对齐后，ocr会给出精确的匹配。我甚至不需要精确地对齐。我想要的是关于如何在将图像发送到

浏览 26提问于2019-05-30得票数 0

回答已采纳

2回答

HTML &rarr；/ &larr；在某些系统上不显示

、、、

我在超文本标记语言中大量使用→/←箭头符号，这样我就可以省去处理图像的麻烦了。这是一个封闭的系统，而不是一个公共网站。现在，我注意到我的客户不知何故在他们的字符集中没有这些符号-我想知道为什么。因为我使用CSS来选择字体，所以字符集应该是相同的，对吗？而且这些<e

浏览 1提问于2011-11-27得票数 3

回答已采纳

1回答

如何获得可能在字符串的任何部分中的结果值号？

、、、、

我使用tesseract.js获取节点js中的图像文本，在我的示例中，字符串如下所示：Tesseract呈现文本: Tesseract呈现文本:我想得到ESR值，它位于结果列下，在第一个情况下是<

浏览 4提问于2022-10-30得票数 0

1回答

Tesseract + opencv 3.0 + windows，文本模块体积小，链接错误

、、、

我的平台是windows 7 x64，我使用VS2013作为编译器，为了将Tesseract 3.04编译为LIB，我遵循了本教程()，但是在成功编译之后，我想用cmake生成vproj，问题是：此外，我试图编译文本模块，添加链接路径到Tesseract，但是当我想在我<e

浏览 5提问于2015-08-16得票数 2

回答已采纳

2回答

iOS .Tesseract OCR为什么识别如此纯粹。发动机原理

、、

我有一个关于Tesseract OCR原理的问题。据我所知，在形状检测之后，符号(它们的形式)被缩放(调整大小)以具有特定的字体大小。这样的字体大小是基于训练数据的。基本上，训练集定义了符号(它们的几何形状，形状)，也许是它们的表示。我使用的是iOS平台上的Tesseract 3.01 (最新版本)。

浏览 19提问于2013-11-21得票数 2

点击加载更多