腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何用R改变tesseract的页面分割方法(PSM)?
、
、
、
、
我想使用tesseract将扫描的PDF文档读入R中。一般来说,这已经很好了,但是当文档有一个表结构时,我会遇到问题。经过一段时间的研究,我发现有一个参数来设置页面分割方法(PSM)。实际上,默认是为图书页设计的,因此更改此参数将导致性能的提高。 非常感谢你的帮助,我不知道还能去哪儿找。
浏览 9
提问于2021-11-05
得票数 0
1
回答
从非结构化pdfs中提取数据
、
、
我有大约200000个PDF,由20个不同的设计组成。也就是说,在一个组织中,不同的(20个)部门每月都会发布提交授标的要求。每个部门都有自己的文件格式。这些文件是由组织收集的。很多pdfs没有结构化,没有标签或书签,没有内容表。 我想知道处理这类问题的最佳技术或方法是什么?
浏览 0
提问于2021-12-23
得票数 0
1
回答
通过平台通道使用摄像头
我有一个使用
OCR
库的java代码,可以使用java代码(初始化摄像头,识别,结果)来使用平台通道吗?我不知道如何在java代码中使用activity。
浏览 2
提问于2020-07-10
得票数 1
1
回答
如果笔迹作者被指示,手写
OCR
是否更准确?
问题用例我们想先将文档输入
OCR
算法。如果
OCR
算法报告的置信度较低,那么我们将把文档传递给一个真实的人进行转录--当然,将结果用于额外的算法培训--这样以后的文档,特别是由同一作者编写的文档,将有更高的机会在令人满意的可信度水平上被转录。对于每个文档,确定文档的作者并给出
OCR
算法是可行的,但也是不平凡的。我们预计将有大约100名作者为800万份文件。
浏览 0
提问于2017-01-12
得票数 2
1
回答
文字识别是否支持
定制
化模板?
浏览 141
提问于2022-06-15
1
回答
阿拉伯数字识别
、
、
我尝试过Tesseract
OCR
,但它不适用于我(它可以识别阿拉伯单词,但不能识别数字)下面是我想要从中提取页码的图像(页面顶部)我试着用imagemagick将这个图像与包含所有可能的书号的较小的已经制作的小图像进行了比较
浏览 5
提问于2015-06-17
得票数 3
1
回答
是否可以为图像有文本数据的单个类训练YOLO (任何版本)。(找到方程的区域)
、
、
、
、
第二,我们如何
定制
低分辨率不像(416,416),因为所有的图像要么是裁剪或水平主要以(W=2H)格式。 我已经实现了YOLO-V3版本的文本数据,但使用的OpenCv,基本上是为CPU。
浏览 8
提问于2020-07-22
得票数 2
回答已采纳
3
回答
将pdf的内容读取为字符串
、
、
如何将PDF的内容以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。PDF来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。我怎样才能获得这个网页,并阅读网址的内容。我试过:但是,我认为这是无效的,因为文件是PDF文件。我能得到帮助
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
2
回答
在Alfresco中是否有更大的字符串数据类型?
、
、
我正在使用一个
定制
的内容模型,我想要有一个
定制
的文本域,用于描述文档。我遇到了这个字段的问题,因为我似乎不能拥有超过1024个字符的d:text属性。 是否有其他属性类型允许我超过此限制?我使用内容模型来描述PDF文档,但这些文档并不总是执行
OCR
,所以我需要description字段使它们可以通过Alfresco进行搜索。
浏览 3
提问于2014-11-13
得票数 1
1
回答
OCR
校正与先前转录?
、
、
我想要创建pdfs,并想知道是否有一种方法,以
OCR
图像和纠正已验证的转录,或‘插入’验证转录在
OCR
过程中?
浏览 0
提问于2014-01-09
得票数 0
回答已采纳
1
回答
使用嵌入字体的iText提取文本
、
、
、
我试图使用iTextSharp (v5.5.12.1)从以下PDF:中提取文本 不幸的是,他们似乎正在使用许多嵌入式
定制
字体,这使我感到失望。目前,我有一个使用
OCR
的工作解决方案,但是
OCR
可能不精确,错误地读取了一些字符,并且在字符之间添加了额外的空格。如果我能直接提取文本,那就太理想了。
浏览 0
提问于2019-07-12
得票数 1
回答已采纳
1
回答
如何下载Abbyy FineReader Engine
、
、
我们需要进行一些
定制
来读取识别出的文本。为此,我们尝试下载Abbyy Fine Reader Engine trail,但链接始终导航到Cloud
OCR
SDK页面。
浏览 18
提问于2017-07-27
得票数 2
1
回答
在TextRecognizer中设置
OCR
白名单
我正在分析
ocr
阅读器示例项目:我找不到任何方法为
OCR
处理器应用高级配置。例如: 谢谢你的帮忙!
浏览 1
提问于2016-08-22
得票数 3
3
回答
字体不变的简化
OCR
、
我正在做一个项目,需要一个更简单、更精确的
OCR
工具 那么,什么是好方法呢?我不想白手起家地写这篇文章,但我不想要一个经过预先训练的过于通用的
OCR
工具。我想把它训练在这个字体上,这样它就能得到非常准确的结果。我也不想做特征提取,把单词分开,找出字母的线条等等。
浏览 5
提问于2011-12-22
得票数 2
2
回答
在Heroku上与Django一起使用Tesseract
、
、
、
我想添加
OCR
功能到我的Django应用程序上运行在Heroku上。我怀疑最简单的方法是使用。可能是通过像这样的
定制
构建包吗?
浏览 10
提问于2013-10-22
得票数 1
回答已采纳
1
回答
在python中从图像创建表
、
我以前从来没有用过
OCR
,我想知道有没有人可以推荐一个像样的python
OCR
,可以把下面的图像转换成2D数组?
浏览 0
提问于2014-04-01
得票数 0
1
回答
请问有图片鉴黄和文字甄别功能吗?现文字违规监控那么严格,有什么好的检测吗?
、
浏览 527
提问于2020-01-12
回答已采纳
1
回答
一个未知方向字符的Python光学字符识别
、
、
、
、
我需要在清晰的背景上对单个字符的图像执行
OCR
。这是一个自主的无人机学生竞赛,所以一切都需要自动和过程不能手工
定制
飞行。然而,字符将在一个已知的集合中(可能是大写字母-数字)。对于上下文,我从任意方向的图像开始:然后,我自动确定角度,裁剪下来,并在通过
OCR
之前对图像进行预处理。我无法事先自动计算的一件事(因为它实际上是
OCR
过程的一部分)是,剩下的4种方向中的哪一种是正确的(见下文)。--这是我问题的关键--是否可以设置
OCR
,以便将A(或任何字符)旋转到90度、180度或270度,而不是认
浏览 0
提问于2018-03-29
得票数 1
1
回答
Tesseract
OCR
无法找到自定义.traineddata文件。
、
、
我正在尝试使用带有电子的“节点-tesseract-
ocr
”模块来执行一些基本的图像到文本的翻译,但是在我的生活中,我遇到了一些我似乎无法理解的问题。我手动安装了Tesseract,并为Tesseract设置了路径变量("C:\Program \Tesseract-
OCR
“和"C:\Program \Tesseract-
OCR
\tessdata”)/screen.png" stdout -l mc --oem 1 --psm 3 Error opening data file C:\Program
浏览 4
提问于2022-07-27
得票数 0
回答已采纳
3
回答
有人可以推荐
OCR
软件来处理发票吗?
我需要
OCR
软件,可以读取各种类型的发票和提取数据。导出的数据应以表格格式显示,最好带有指向源文档的链接。它必须能够读取各种格式的文档(.pdf、.jpg、.gif、.tiff等)。
浏览 1
提问于2010-12-27
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
搜狗OCR+百度OCR+有道OCR
深度学习OCR与传统OCR有何区别?哪种更好?
OCR识别软件,有什么可以ocr识别的软件
OCR技术简介
通用OCR介绍
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券