为什么google vision api的结果与网站上的ocr不同？

文章/答案/技术大牛

发布

1回答

我尝试使用Google Vision API的OCR图像： API返回的结果文本：我从谷歌网站上得到的结果文本\n" 从谷歌

浏览 7提问于2018-08-08得票数 1

回答已采纳

4回答

工具包无法加载OCR模块

、、、、

我正在开发一个涉及ML工具包的android应用程序。我研究了一下如何设置Android来使用Firebase的。然后我开始使用文本识别API。令我惊讶的是，当我对它进行API调用时，成功列表被击中，出现了以下日志： I/DynamiteModule: Considering local module com.google.firebase.ml.vision.dynamite.barcodeI/native: barcode_detector_cl

浏览 40提问于2019-10-20得票数 13

回答已采纳

2回答

Google Vision API文本检测异常行为- Javascript

、、

最近，关于Google Vision API的一些事情发生了变化。我正在使用它来识别收据上的文本。到现在为止一切都很好。突然，API开始以不同的方式响应我的请求。我今天向API发送了相同的图片，我得到了不同的响应(与过去不同)。我确保代码中没有任何更改，所以这不是罪魁祸首。另一件奇怪的事情是，当我在textAnnotations

浏览 1提问于2017-06-25得票数 4

1回答

使用Google* Vision *API进行表格识别

我使用Google Vision API的OCR function (DOCUMENT_TEXT_DETECTION)来处理不同的医疗文档。里面有一些表格。根据谷歌的文档，有一个特殊的表格BlockType (https://cloud.google.com/vision/docs/reference/rpc/google

浏览 45提问于2021-10-14得票数 2

回答已采纳

2回答

VIN扫描库或SDK for android

我在一个需要VIN扫描的android应用程序上工作。我没有找到任何好的库或sdk来做同样的事情。我试过Zxing，但它不能进行VIN扫描。有人能帮我在我的应用程序中实现VIN扫描吗？

浏览 4提问于2012-06-02得票数 1

1回答

基于Tesseract的鸡蛋标记识别图像预处理

、、、

目标是开发一个能够识别鸡蛋标记的应用程序，例如0-DE-134461。我在下面的图像上尝试了和。两个OCR引擎的结果都是灾难性的。 Tesseract → ""3-ES08234 08234-25591Google Vision" Googl

浏览 1提问于2017-08-31得票数 8

1回答

谷歌云视觉与谷歌存储

、、、、

我正在制作一个文本检测应用程序，使用谷歌视觉api。这是我从获得的代码引用，但是当试图像图表一样打开url= gs://时，错误消息会显示无效参数。然后，我发现，当它被部署到云功能上时，google将从存储加载图像。但是怎么做呢？，我找不到任何相关的文件，给出了详细的处理过程。我对代码很陌生，很难找到这些指令。或者提供一个关于这个的参考链接？谢谢!

浏览 9提问于2022-12-02得票数 0

回答已采纳

2回答

代码403：“请求缺少一个有效的API密钥。”PERMISSION_DENIED服务帐户键Google

、、、、

我想使用一个服务键用ImageAnnotator实现Google。我所做的尝试如下： $this->load->view('index'); function upload_ocr_imageassets/google_cloud_vision</e

浏览 1提问于2019-04-02得票数 0

回答已采纳

2回答

Firebase ML工具包无法准确识别语言(英语或其他)

、、、、

我正在开发一个使用firebase ML Kit的android文本识别器应用程序。当我捕获文本图像时，问题是没有获得图像的实际结果，为什么？？我认为我的应用程序不能很好地识别语言。我使用过的依赖项 implementation 'com.google.firebase:firebase-ml-vision:20.0.0' 识别文本和处理文本代码 /**

浏览 23提问于2020-10-26得票数 0

回答已采纳

6回答

谷歌云视觉API* "PERMISSION_DENIED“*

、

但是“云视觉API”是为项目启用的。任何帮助都是非常感谢的。来自Google资源管理器的错误详细信息 "error": { "message": "Project hasnot activated the vision.googleapis.com API.Please enable the API</

浏览 4提问于2016-02-21得票数 6

回答已采纳

1回答

Google Cloud Vision API在线定价与离线定价

、、

我需要一个即插即用的文本识别系统，在尝试了一些解决方案后，例如Tesseract OCR，Google的Vision API似乎对我产生了最好的结果。然而，我以前从来没有使用过他们的任何云API，但我注意到它能够工作在offline？计费是如何工作的呢？根据我的理解，每1000张图片的在线版本收费，离线库不会绕过这一点吗？线上和线下的质量有什么不同</em

浏览 48提问于2019-09-10得票数 0

回答已采纳

3回答

识别图像中的扑克牌

、

我一直在尝试使用各种图像识别api (google vision api、vize.ai、azure的计算机视觉api等等)，但它们似乎都不能很好地工作。我已经训练了API，每张卡大约有40个不同的图像，具有不同的角度，背景和照明。我也试过使用ocr(通过google vision api)，它只适用于一些卡片，可能是因为一些卡

浏览 3提问于2017-12-11得票数 1

1回答

Google Vision API -将OCR结果拆分到不同的行？

、、、

我正在尝试使用C#中的Google Vision API来处理具有多行文本的图像。我希望每一行都是一个单独的字符串，但API将其全部放入一个字符串中。我试着在开始时按大写字母过滤，但有些行在每个单词的开头都有大写字母，所以它并不总是只在每行的开头。谢谢:)

浏览 5提问于2018-02-08得票数 0

2回答

Google文本检测api - Web演示结果与使用api不同

、、、

我尝试使用谷歌视觉API文本检测功能和谷歌的网页演示，以OCR我的图像。两个结果是不一样的。我的api结果："SAMSUNG Galaxy M20Siêu Pin vô doi, sac nhanh tuc thiMoiSAM

浏览 0提问于2019-07-12得票数 0

3回答

用于检测钞票的OCR

、

我正计划创建一个移动应用程序，它可以扫描商店生成的账单/发票，并从中提取关键特征，如店铺名称、地址、购买的物品、账单价值等。我知道我可以使用OCR从账单中提取文本(扫描的账单或账单的照片)，但我如何提取所有这些详细信息？使用什么方法？

浏览 1提问于2017-05-22得票数 3

1回答

谷歌云视觉AutoML与TensorFlow对象检测差异

、、、、

谷歌云视觉自动ML和Google张量流有什么区别？只是想弄明白这两种成分。 

浏览 0提问于2021-04-06得票数 1

回答已采纳

1回答

在浏览器演示和python中的区别

、、

我对相当陌生，所以如果有明显的答案的话，我很抱歉。我注意到，对于某些图像，我在Google拖放()和python中的本地图像检测之间得到了不同的OCR结果。我的代码如下# Imports the Google Cloud client libraryfrom google.cloud.vision</em

浏览 0提问于2018-06-15得票数 3

回答已采纳

2回答

用于侧输入的高效ParDo设置或start_bundle

、、

列表A: 25M散列我想检查列表B中的每一个散列是否存在于列表A中。为此，我有一个ParDo函数，当它不匹配时，我会放弃它。这是一个去重复的过程。我如何有效地设置这个ParDo，现在我在处理列表B时做一个列表A的侧输入，但是不应该将侧输入转到ParDo的setup()或start_bundle()，所以我只在工作人员中存储一次查找列表(A)？TA_HASH'] not in hashlist: else:

浏览 0提问于2020-03-17得票数 2

1回答

谷歌视觉十六进制数字识别

、

Google能够识别经常出错的十六进制数字(准确率约为60%)。例如，当我试图识别带有“78303D 61”的扫描图像时，Google会识别它的文本，比如“78303061”。对于OCR识别，我使用了和.NET Api客户端，结果也不正确。以下是我的C#代码： var image = await Google.Cloud.Vision.V1.Image.FromFileAsync("c:\\path\\to

浏览 3提问于2020-12-08得票数 0

1回答

如何将Django request.FILES (图像)读取为二进制

、、、

我希望从请求中获得一个二进制图像，其中包含来自ajax.的图像文件。如何在views.py中获得二值图像？我认为下面的代码会起作用，但不起作用。我也不知道为什么。\liam\dev\git\mdd_bean_env\lib\site-packages\google\api_core\grpc_helpers.py",

浏览 1提问于2019-08-18得票数 4

回答已采纳

点击加载更多