ocr 文字识别系统 - 腾讯云开发者社区

、、、

抱歉，如果这个问题是愚蠢的或含糊的，但我的任务是让ocr在我的实习期间在服务器端实现。我在哪里可以获得合适的api来将其与我公司的站点集成。

浏览 5提问于2016-06-09得票数 1

1回答

OpenCV:如何从黑白图像的特定部分删除文本

、、

早上好。理想结果1：然而，OCV很难检测出用日语或韩语形成的文本，所以我想，也许更容易找到一种算法来识别语音气泡的形状，并用白色填充它们的内部，从而消除文本。问题是我对OCV or Tesseract没有太多的了解，我甚至不知道从哪里开始，如何开始。

浏览 1提问于2020-10-11得票数 0

2回答

图像预处理方法，可以用来识别工业零件的名称(卡住或雕刻)的表面？

、、

我正在做一个项目，我的任务是识别机械零件，它的零件编号写在标签上，或刻在其表面上。标签和雕刻部分的一个这样的例子如下图所示。我的任务是识别9或10个字母数字(第一图像中为03c 997 032 D，第二图像为357 955 531 )。这似乎是一个容易的任务，但我面临的问题是如何区分图像中的有用信息和部分的其余部分，即两个图像中都有许多其他数字和字符，我只想重点讨论提到的数字。我尝试了很多事情，但到目前为止都没有成功。有人知道图像预处理方法或任何我应该应用的ML/DL模型来获得所需的结果吗？

浏览 10提问于2020-01-03得票数 1

回答已采纳

1回答

手写英文字符数据Set..Where to get (公开提供)

、、、

我们已经创建了一个手写字符识别系统，现在想要在英文字符(数字和字母)上测试该系统。对于digits，我们已经在MNIST数据集上进行了测试。然而，对于英文字母表，我们还没有找到任何公开可用的(即免费的)标准数据集。我们所能找到的只有和手写数据集，它们可以在各自的官方网站上找到，但它们的成本很高。是否有其他公开可用的英文字母标准数据集可用于测试手写字符识别系统。

浏览 124提问于2013-06-25得票数 31

1回答

同步文本和音频。有没有NLP/语音到文本库来做这件事？

、、

我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点？我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。我到目前为止发现的是：

浏览 1提问于2010-11-01得票数 14

回答已采纳

1回答

是OCR还是ANN？

、、

我是一名大四的大学生，我正在做一个车牌识别系统作为我的大四项目。我想知道当识别最适合的字符时，是人工神经网络(ANN)还是使用模式匹配的光学字符识别(OCR)？或者有什么简单的方法可以使用吗？

浏览 1提问于2010-08-18得票数 0

回答已采纳

1回答

如何在列表控件中使用checkbox

、、

嗨，我一直在做我的最后一个项目关于识别系统的IMEI号码。我使用c++MFC，我得到了MySQL中的数据库列表控制和设置复选框的LVS_EX_CHECKBOXES。如果编辑控件中的数字像listcontrol中的imei一样，我会将图片OCR到所有编号。让程序在空白处交叉。 it镜像项目帮助指导我，谢谢。

浏览 4提问于2014-01-19得票数 0

1回答

如何将图像OCR用于视频？

、、、

目前我正在开发自动车牌识别系统。我已经使用yolov7的号码板检测和文本检测设施，从谷歌视觉API。我用测试图像测试了整个系统。现在我愿意开发一个系统来检测和读取视频源中的车牌。我可以为视频做检测部分，而我被卡住的地方是使用OCR作为视频中检测到的绑定框。我

浏览 9提问于2022-09-13得票数 1

1回答

基于Tesseract OCR的汉字识别

、、、

我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取。但是，如果我使用中文文本图像并通过OCR，则Tesseract不会为我提供中文字符，而是我将获得数字和英文字符。但我需要在我使用的图像中显示的中文字符。我如何才能做到这一点？有没有办法获得中文字符而不是其他字符？

浏览 7提问于2013-05-16得票数 16

回答已采纳

1回答

Google Cloud Vision API在线定价与离线定价

、、

我需要一个即插即用的文本识别系统，在尝试了一些解决方案后，例如Tesseract OCR，Google的Vision API似乎对我产生了最好的结果。

浏览 48提问于2019-09-10得票数 0

回答已采纳

1回答

什么是光学字符识别中的表示？

、、、

我正在学习OCR和阅读这本书光学扫描前处理表象识别这就是他们写的关于表示的内容(#5)。第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下，灰度或二值图像被输入到识别器。然而，在大多数的识别系统中，为了避免额外的复杂性和提高算法的准确性，需要一个更紧凑、更有特征的表示。第六个OCR组件是特征提取。特征提取的目的是捕捉符号的本质特征。特征提取是

浏览 0提问于2017-06-06得票数 4

2回答

将文本和数字字符串更改为数字

、、

我目前正在使用Sikuli API中的OCR工具从以下屏幕中查找交易ID：它会找到文本，并在稍微清理后返回以下内容：My Numbers is...How最好用正确的数字替换从光学字符识别系统生成的字母字符对于那些感兴趣的人，我将发布我用来使OCR工作的代码，因为大多数关于这方面的通信都超过2年了。

浏览 1提问于2015-10-23得票数 2

2回答

如何获取base64编码的字符串创建的图像中显示的值？

、、、、

如果唯一的答案是某种类型的OCR技术，那么任何关于从哪里开始的建议，特别是与将其嵌入到Ruby脚本中相关的建议，都将不胜感激。提前感谢！

浏览 0提问于2015-09-30得票数 1

1回答

什么是光学字符识别中的表示？

、、

我正在学习OCR，正在读这本书。作者定义了8个过程来实现一个接一个的OCR (2后1，3后2等等)：这就是他们写的关于表示的内容第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下，灰度或二值图像被输入到识别器。然而，在大多数的识别系统中，为了避免额外的复杂性和提高算法的准确性，需要一个更紧凑、更有特征的表示。第六个OCR组件是特征提取。特征提取的目的

浏览 0提问于2017-06-06得票数 3

回答已采纳

11回答

自然场景文字识别技术及在地图中的应用

随着互联网和移动互联网技术的高速发展，越来越多的新型应用场景需要利用自然场景图像中的文字信息。

浏览 2194提问于2018-08-24

1回答

OCR文字识别？

浏览 169提问于2022-06-15

2回答

是否扫描视频中的文本字符串？

我的目标是从电影预告片中找到标题屏幕。我需要一个服务，我可以在视频中搜索字符串，然后返回带有该字符串的帧。很难理解，有没有这样的东西存在？编辑:我发现，假设我需要将视频分割成1s的间隔并扫描每一张图像(每个视频至少60个呼叫)，那么除了成本之外，实际上可以工作的是禁止的@ $.04。

浏览 3提问于2016-03-16得票数 0

3回答

文字识别OCR接口本地图片下载失败？

、、、

用文字识别OCR的Python接口调用来对本地图片进行识别，报错“下载失败”，FailedOperation.DownLoadError message:下载失败。参照这个官方样例https://github.com/TencentCloud/tencentcloud-sdk-python/blob/master/examples/ocr/v20181119/general_fast_ocr.py

浏览 1649提问于2020-03-07

1回答

分割文本和背景作为OCR (Tesseract)的预处理

、、、

我正在对电视镜头中的文字应用OCR。(我正在使用Tesseact 3.x w/ C++)我试图将文本和背景部分分割为OCR的预处理。与通常的镜头，文字和背景是高度对比(如白色和黑色)，因此修改伽马将完成这项工作。然而，这个附加的图像(黄色文本背景为橙色/红色天空)让我很难做预处理。从背景中分离黄色文本的好方法是什么？

浏览 4提问于2017-04-25得票数 0

回答已采纳

1回答