腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在web应用程序中,
OCR
(光学字符识别)应该使用客户端或服务器端。
、
、
、
我将
扫描
一个图像并上传到数据库中。我使用mongodb存储文档,.There是在文件中搜索的要求,如果我使用
OCR
,这是可能的。所以我应该在客户端还是服务器端使用
ocr
。( 1)
扫描
一个或多个文件。2.1)
OCR
扫描
图像,并将其保存为PDF
格式
,并随
OCR
结果一起上载到数据库。4)以pdf
格式
以查看器加载文件。 因此,请建议我最好和最简单的方式来实现我的目标。
浏览 3
提问于2016-12-13
得票数 0
回答已采纳
1
回答
用于从PDF中提取数据的自然语言处理
、
我有许多不同
格式
的
扫描
pdf与许多不同的领域。把它想象成一张已经
扫描
过的发票。我需要从
扫描
的pdf中提取信息,并输出字段和每个字段中的文本。 我有一个
OCR
工具,它可以很好地提取原始
格式
的所有文本。由于发票的
格式
有很多种,因此在这种情况下不能使用
OCR
。NLP如何帮助我解决这个问题?
浏览 6
提问于2017-10-05
得票数 0
1
回答
Google Drive API
扫描
文档
、
我需要包含将文档
扫描
到我的应用程序中的功能。可以使用新的Google drive API来
扫描
文档吗?我尝试使用OpenCV来处理图像,但是没有得到好的结果。
浏览 1
提问于2014-07-17
得票数 2
1
回答
将
扫描
的PDF表格转换为Excel
、
、
、
我有一个
扫描
的PDF,其中有一些表格
格式
的随机数据,并希望将其复制到Excel工作表。 我试过使用数字PDF,使用'tabula‘来提取表格,但
扫描
的PDF需要
OCR
(我在google上看到的)。我知道涉及到
OCR
(Tesseract),但不知道我应该采取什么方法来解决这个问题。
浏览 7
提问于2019-06-20
得票数 0
1
回答
检测景观
格式
的图像,并将其分割成两幅肖像。
、
、
、
、
我已经
扫描
了PDF
格式
的文件。这些文件包含一页纵向
格式
和两页横向
格式
的页面。从现在开始,我只有一个脚本的开头: #!--clean-final --optimize 3 "$i&qu
浏览 2
提问于2020-04-20
得票数 1
3
回答
是否有用于图像
扫描
的可可框架?
、
、
、
、
对于Mac OS X上的图像
扫描
框架,我有哪些选项?我不是在找
OCR
库。只是一些东西,将做实际的
扫描
和导入PDF或类似的
格式
。
浏览 0
提问于2010-08-31
得票数 6
回答已采纳
4
回答
扫描
仪
扫描
文档的最佳设置(TIFF和PDF)
、
、
为了
扫描
文档(白色和黑色文本)并将其用于
OCR
转换(以获得最佳效果),
扫描
仪的最佳设置是什么? PDF和TIFF
格式
的标准设置和规范是什么?
浏览 1
提问于2013-09-05
得票数 1
1
回答
在尝试解析具有文本包含图像的pdf时使用Apache tika解析器的问题
、
、
、
、
我使用这两个依赖项:- tika核心2.6.0tika解析器标准包2.6.0 .Parsing在这些情况下很好地工作:- pdf文件和文本。pdf文件与图像。文本文件和其他扩展名。有人能在这里建议如何解决失败的案件吗?谢谢org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:312) ~org.apache.tika.tika-core-2.6.0.jar:2.6.0 at org.apache.tika.pars
浏览 19
提问于2022-11-11
得票数 0
1
回答
如何下载谷歌
扫描
的.pdf OCRed?
、
我有一个电子邮件与
扫描
的.pdf附加在我的Gmail帐户。当我点击“查看”,我看到谷歌有OCRed它。当我单击“下载”时,PDF是原始的,即不包含OCRed。
浏览 0
提问于2012-11-26
得票数 2
1
回答
为什么要使用RecursiveParserWrapper而不是解析器来从图像中提取文本?
、
我使用TIKA和Tesseract从包含
扫描
图像的pdf文件中提取
OCR
文本。我已经设法用ResursiveParserWrapper而不是解析器解析包含图像的pdf文档,它工作得很好,但是客户端希望在其他地方完成与Tesseract
OCR
相关的所有配置,并使用现有代码从所有支持的
格式
中提取
OCR
文本。谁能帮我解释一下,当我们要从包含
扫描
图像的图像或pdfs中提取数据时,为什么我们使用RecursiveParserWrapper而不是普通的解析器。
浏览 3
提问于2018-06-25
得票数 0
1
回答
如何在vb.net中读取
扫描
的驾照文件?
我有一个
扫描
过的bmp
格式
的驾照文件,可以读取vb.net
格式
的驾照信息吗? 请帮助我,如何读取驾驶员执照
OCR
的详细信息?
浏览 5
提问于2010-04-29
得票数 1
11
回答
免费的
OCR
软件,使PDF可搜索(与可搜索的文本在正确的地方)
、
、
、
、
是否有任何免费的
OCR
软件(用于Linux和/或Windows)可以像Acrobat那样将PDF
扫描
文档作为输入并输出可搜索的PDF?使用可搜索的PDF
格式
,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。我知道Linux上的gscan2pdf可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景
扫描
页面上的文本完全不同步。这是因为gscan2pdf将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或小段落发送到
OCR
软件。
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
1
回答
写入
扫描
文件的图片
、
、
、
我有一个
扫描
的合同,我只需要更改几个名字和日期在合同。谢谢你的帮助
浏览 0
提问于2011-04-19
得票数 0
回答已采纳
1
回答
需要一个Info和WIA驱动程序来
扫描
C#中的图像?
、
、
我在这个
扫描
仪中有一些问题,使用的是C#.net中的WIA或TWAIN。我们计划购买柯达i920
扫描
仪,通过我们在C#中的应用
扫描
图像。我的问题是 有些
扫描
仪有内置的
OCR
功能。我能用那个
扫描
仪的
OCR
功能编程吗?因此,当我点击
OCR
按钮时,
扫描
仪必须
扫描
一个do
OCR
并将我还原回原处
浏览 3
提问于2011-09-08
得票数 1
回答已采纳
1
回答
Windows
扫描
套件
、
我正在寻找一个
扫描
套件,我的Windows 10家庭笔记本电脑,我可以使用与我的Richo全合一。能够将多个页面
扫描
到一个PDF中
OCR
的能力,并创建一个PDF与可选择的文本。 我对免费的,甚至付费的软件开放。
浏览 0
提问于2017-07-25
得票数 4
4
回答
议会辩论中PDF的光学字符识别
、
、
、
、
对于一个合同工作,我需要数字化的许多旧的,
扫描
-图形的全体辩论协议PDF来自德国联邦议会。问题是,这些文件大多采用两列
格式
: 诚挚的问候, 塞廷塞特
浏览 11
提问于2009-07-09
得票数 0
1
回答
如何将所有图像转换为Word文档中的文本?
、
这些图片中有文字,我找不到一个工具,可以很容易地做到这一点,最好没有任何安装。
浏览 0
提问于2011-02-17
得票数 0
1
回答
使用python从PDF中提取
扫描
页面
、
我有很多PDF文件,基本上是
扫描
文档,所以每一页都是一个
扫描
图像。我想要执行
OCR
并从这些文件中提取文本。我尝试过pytesseract,但它不直接对pdf文件执行
OCR
,因此,作为一项工作,我希望从PDF文件中提取images,将它们保存在目录中,然后直接在这些图像上使用pytesseract执行
OCR
。在python中有没有从pdf文件中提取
扫描
图像的方法?或者有任何方法可以直接对pdf文件执行
OCR
?
浏览 1
提问于2018-05-26
得票数 0
回答已采纳
1
回答
我想从
OCR
数据中提取表信息。
、
、
、
我想从
OCR
数据中提取表格信息,我有原始文本和它的文本。我试过pytesseract,但找不到实际的实现。我试过这个: 这种方法对我一点用也没有。我希望从
OCR
数据中获得此表的表格结构,以供进一步处理。
浏览 3
提问于2019-01-20
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
智聆口语评测
活动推荐
运营活动
广告
关闭
领券