汉字识别ocr - 腾讯云开发者社区

文章/答案/技术大牛

发布

3回答

基于Tesseract OCR的汉字识别

、、、

我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取。但是，如果我使用中文文本图像并通过OCR，则Tesseract不会为我提供中文字符，而是我将获得数字和英文字符。

浏览 7提问于2013-05-16得票数 16

回答已采纳

2回答

开放源码中文OCR

、、、

我到处寻找开放源码的OCR，寻找中文。但如果没有任何运气，似乎很少有一些开放源码的OCR (为中文)是可用的。environment?What's是否有用于制作的开放源码？对于拉丁文和中文实现OCR的主要区别是？我知道一些好的OCR，如Tesseract或Ocropus，如果我想让它支持中文，我该怎么办？如有任何帮助，请提前表示感谢。

浏览 3提问于2009-12-15得票数 9

回答已采纳

1回答

OCR和汉字符号的算法

、

他希望能够使用某种OCR来检测汉字符号并将其翻译成其他语言。为了做到这一点，他在寻找可用的算法方面遇到了一些困难，因为这些符号比我们习惯的英文字符要复杂一点。我们建议他开始研究2D卷积和傅立叶变换，以开始模式识别过程，但他正在寻找一个好的起点。不幸的是，我的OCR知识非常有限，所以我能提供的任何建议都可能是最有帮助的！

浏览 3提问于2010-04-23得票数 3

回答已采纳

1回答

带有文件插入的汉字OCR

我试图OCR一个文件插入到谷歌驱动器。正在插入的图像包含汉字。当OCRing时，图像会像往常一样转换为Google，但是没有一个文本被提取出来。这不会返回错误，但不会发生OCR。根据docs，这个参数只是一个提示，如果OCR引擎能够计算出语言，它就会被覆盖。所以我的问题是：注:在浏览器中上传图像时，OCR语言下拉式包含

浏览 3提问于2014-07-25得票数 1

3回答

日本最精确的开源OCR？

、、

根据您的经验，什么是最准确的开放源码光学字符识别(OCR)库/软件来读取日文文本？日本旧手机(特别是夏普手机)在10年前就有了很好的日本OCR，所以我想它在开源中也是可行的。

浏览 0提问于2015-02-03得票数 6

2回答

手写输入，主要在Flash中完成，好奇它是如何识别字符的

、、

是一个帮助用户通过写入flash应用程序来查找他们不认识的汉字的网站，然后它会搜索数据库，带回相关的汉字。这是如何工作的。它不能是OCR，因为那将永远花费时间。

浏览 1提问于2011-01-02得票数 0

回答已采纳

2回答

填补因ocr去行而造成的汉字空白

、、、

您好，朋友们，我有一段时间很难ocr上面的图像，由于线removal.So造成的间隙，谁能善意地指导我如何使用imagemagick填补汉字的空白

浏览 30提问于2020-07-31得票数 1

2回答

绘图符号识别:如何实现识别

、

我尝试实现对鼠标绘制的汉字的识别。对于我想要识别的每个汉字，我都有一个样本文件，它提供了所有笔画的开始和结束位置，以及各自笔画的开始和结束位置(对于固定的图像分辨率)。我想知道如何使用这些笔画信息来识别汉字。我在考虑使用笔画开始和结束之间的斜率，并将其用作机器学习的特征，但如果每个汉字只有一个样本，我将有大约2000个类(每个汉字一个)和数据稀疏问题(每个汉字只有一组笔画信息)。

浏览 2提问于2014-05-01得票数 0

5回答

找一种工具：通过这个工具扫描一张发票，可以把这张发票的信息提取出来，在腾讯云上是否有这种工具？

浏览 10050提问于2017-09-22

3回答

计算机视觉-从A的图像中识别A

、、

我真的更喜欢简单的方法--它不是识别任意字符，而是'A‘。但如果不能这样做，任何让计算机将这两者视为A的解释都是非常受欢迎的。 (预先谢谢:)

浏览 7提问于2015-10-31得票数 0

回答已采纳

1回答

我有一些日语文本，但有些非日文汉字被混淆了。我注意到这是因为我使用的日文字体不支持它们，浏览器使用不同的字体呈现它们。据我所见，这些字符没有在日语中使用，所以它们错误地到达了那里(文本来自OCR)。我用在文本中找到汉字，但它似乎能处理所有的汉字，而不仅仅是汉字。有没有任何可靠的方法来检测那些非日文字符，比如检查unicode的某些部分？我能想到的唯一解决方案是列出一个完整的汉字列表(或者更像是找到一个)，并检查每个字符是否在列表上，但我怀疑这可能有点慢。尽管如此，如果我找不到更好的方法来

浏览 10提问于2014-07-27得票数 0

回答已采纳

1回答

Google TEXT_DETECTION能支持在一幅图像中识别多种语言吗？

、、

我们能不能说出图像中期望使用哪种语言，以便引擎能够找到识别所有字符的方法，即使它们使用的是不同的语言？ 2.然后我试着裁剪图像，使其只有汉字。。这三个汉字可以被成功识别。

浏览 2提问于2016-06-22得票数 5

回答已采纳

1回答

最容易编码的4个视觉位？

、、、、

那么，我能打印出来的16样东西在严酷的角度和长距离下最容易和有效地识别出来，而不是相互混淆或与普通的家庭物品混淆？容易实现的想法加分。

浏览 0提问于2014-01-24得票数 1

回答已采纳

1回答

我已经用Io.card sdk做了信用卡扫描，但是找不到借记卡扫描的解决方案。

我已经用Io.card软件开发工具包做了信用卡扫描，但是我找不到扫描Debit card.Can的解决方案，有谁能帮我解决这个问题...

浏览 47提问于2018-05-31得票数 0

1回答

Vim运行所有以相同名称开头的文件类型插件

、

例如：这些文件具有不同的版本。因此我有不同的ftplugins：当打开一个光学字符识别文件，文件类型被检测为‘光学字符识别’->的光学字符识别基础-File插件将加载。它检查文件的版本(例如01) =>文件类型将被设置为ocr_01。我期望，只有文件类型插件ocr</

浏览 8提问于2013-07-26得票数 0

1回答

将pdf转换成波斯语文档的OCR软件

、

在波斯语中，大多数OCR依赖于框架，而不是免费的。在波斯语中，有网上免费的OCR吗？

浏览 0提问于2016-05-31得票数 3

回答已采纳

1回答

如何用汉字打印测试结果

、

我正在尝试让我的程序使用Tesseract来识别中文，它起作用了。我遇到的唯一问题是把结果打印成中文字符，结果是用拼音打印出来的(你怎么把中文单词打成英文)。from unidecode import unidecode pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR结果应该是图像中所示的汉字。

浏览 15提问于2019-09-10得票数 3

0回答

调用OCR营业执照识别报内部错误？

、

调用调用OCR营业执照识别报“内部错误”这种不明不白的提示，相同的header，相同的multipart/form-data确报“内部错误”看不明白什么意思。

浏览 318提问于2019-07-10

2回答

尽管输入了确切的语句，AWS Lex仍然匹配错误的意图。

、、、

一个答案是“什么是命名实体识别”--这是它的话语：当我进入时，“ocr</

浏览 4提问于2019-03-22得票数 2

回答已采纳

点击加载更多

手写表单，怎么定位识别区域。每张图片像素大小都不确定？

基于Tesseract OCR的汉字识别

开放源码中文OCR

OCR和汉字符号的算法

带有文件插入的汉字OCR

日本最精确的开源OCR？

手写输入，主要在Flash中完成，好奇它是如何识别字符的

填补因ocr去行而造成的汉字空白

绘图符号识别:如何实现识别

找一种工具：通过这个工具扫描一张发票，可以把这张发票的信息提取出来，在腾讯云上是否有这种工具？

计算机视觉-从A的图像中识别A

我能在文本中检测到非日文汉字吗？

Google TEXT_DETECTION能支持在一幅图像中识别多种语言吗？

最容易编码的4个视觉位？

我已经用Io.card sdk做了信用卡扫描，但是找不到借记卡扫描的解决方案。

Vim运行所有以相同名称开头的文件类型插件

将pdf转换成波斯语文档的OCR软件

如何用汉字打印测试结果

调用OCR营业执照识别报内部错误？

尽管输入了确切的语句，AWS Lex仍然匹配错误的意图。

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐