腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3484)
视频
沙龙
2
回答
可将OCR文本插入回源
PDF
的OCR库
、
是否有库(或可执行文件)可以OCR
PDF
(通常是通过
扫描
纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是
扫描
图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
关于拆分
PDF
和OCR
识别
、
、
、
我有很多
pdf
文档,它们都是
扫描
过的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我知道Python的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别
字符并将输出转换为csv或文本文件。 提前感谢您……
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
2
回答
OCR不再是一个问题了吗?
、
、
根据
的说法,“拉丁
文字
、打字文本的准确
识别
现在被认为是一个很大程度上解决了应用程序中的问题,这些应用程序可以获得清晰的成像,例如
扫描
打印文档。”然而,它没有给出任何引用。或者,这个问题的一个较不主观的形式是:现代OCR系统在
识别
英文文本以获得高质量
扫描
方面的准确性如何?
浏览 1
提问于2009-10-19
得票数 4
回答已采纳
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从
扫描
页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
帮助Canon CanoScan LiDE
扫描
PDF
文档
、
、
、
我的佳能CanoScan LiDE 110
扫描
仪出了问题。当我使用Windows 7中的
扫描
仪,并将
扫描
过的书籍页保存为
PDF
格式时,我可以打开
PDF
扫描
页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我尝试在Ubuntu中使用简单的
扫描
应用程序进行同样的操作。我通过简单的
扫描
将页面
扫描
为文本,并将其保存为
PDF
格式。但是在Ubuntu中,当我打开
扫描
的
PDF<
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
2
回答
buffio.Scanner和文本/
扫描
仪有什么区别?
、
与包和.的区别是什么?
浏览 4
提问于2014-08-01
得票数 1
回答已采纳
1
回答
在Tesseract OCR中是否有从
PDF
中查找字符串和删除页面的属性?
、
、
、
、
我试图在Tesseract OCR中将Image转换成文本
PDF
。在中间,我需要检查封面页,并从结果中删除。在Tessaract OCR中是否可以
根据
封面的特定属性(封面文本匹配)来
识别
封面。或者,我是否需要获取tessetact OCR结果的全部输出,并提供我的逻辑来
扫描
PDF
和删除封面页。我非常困惑,任何帮助都将不胜感激。
浏览 1
提问于2018-09-20
得票数 0
回答已采纳
1
回答
使用PDFRenderer打印
PDF
-形状不是锐利的
、
、
我需要打印
PDF
运输标签。这些标签是
PDF
格式的。印刷的运输标签有尖锐的
文字
,但有问题的条形码有小的“齿轮齿”-条形码-条纹是不光滑的边缘,这是问题的
扫描
仪。我试图使用
PDF
-创建者作为打印机,并将其打印到文件-条形码是尖锐的,然后(在PC显示器)。我也尝试使用
PDF
-创建者打印已经创建的文件(如上面所示),然后用
PDF
打印它,在这种情况下条形码是尖锐的。我在热敏打印机Zebra 2844上测试它,而打印机只支持一种模式80 DPI (
根据
PrintS
浏览 2
提问于2017-04-20
得票数 0
回答已采纳
1
回答
如何
识别
图像文件中的文本,以及如何阅读该文本?
、
、
在图像格式中有满满的
文字
。(E)以图像文件*.tiff格式
扫描
的文件。光学字符
识别
方法只
识别
正常格式的字母表。在这种图像格式中包含的
文字
就像行文一样。那么如何
识别
中的文本并将其转换为文本文件呢?
浏览 8
提问于2014-10-11
得票数 2
6
回答
检查
PDF
文件是否为已
扫描
的文件
、
、
以编程方式检查
PDF
文件是否完全
扫描
的最佳方式是什么?我有iText和PDFBox可供我使用。我可以检查一个
pdf
文件是否包含文本,并
根据
结果来决定这个文件是否是OCRed,但这个解决方案不是100%准确。我想知道有没有别的办法来解决这个问题。 正如您所理解的,解决方案必须是基于Java的。
浏览 3
提问于2010-03-09
得票数 10
回答已采纳
2
回答
如何将
pdf
扫描
图像转换为最适合ocr的高分辨率tiff?
、
、
我转换
pdf
到tiff图像与图像魔术,从500 to到4.6mb的文件大小。convert \pph-psd.tiffTiff图像: 为什么会发生这种情况,以及如何将
pdf
扫描
图像转换为最适合ocr
浏览 1
提问于2018-05-16
得票数 0
回答已采纳
1
回答
imagemagick检查图像是否为几乎一种颜色
朋友,我想
识别
这些彩色的纸图像。问题: 我的想法是看看90%的图像是否是某种绿色的,并尝试使用排序直方图。而是因为(1)和(尤指)。编辑:这里有三个样本图像,
浏览 8
提问于2022-07-13
得票数 1
回答已采纳
1
回答
ZXing
PDF
417 + ALL_CODE_TYPES
、
、
使用ZXing (在安卓上),如果你启动像这样的
PDF
417条形码
扫描
.List<String> oDesiredFormats = Arrays.asList("
PDF
_417".split(",")); IntentIntegrator integrator = new你启动一个“所有代码”(除了
PDF
417和其他几个)条形码
扫描
像这样.那么,如何启动一次条形码
扫描
,同时
识别
(所有标准代码和
PDF
浏览 5
提问于2014-03-21
得票数 2
回答已采纳
1
回答
如何使用python
识别
pdf
中的图形?
、
、
、
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
在图像中查找已知文本(引导OCR)
、
具体来说,我正在创建一个工具,将一组
扫描
页面转换为支持搜索和copy+paste的
PDF
。我理解这通常是如何做到的: OCR页面,保留文本的位置,然后将文本作为不可见层添加到
PDF
中。Acrobat具有此功能,tesseract可以输出hOCR文件(包含
识别
的文本及其位置),hocr2
pdf
可以使用这些文件生成文本层。将已经知道的文本与
扫描
页面上的位置匹配起来似乎要容易得多,但我没有发现任何具有这种内置功能的软件。我如何利用现有的软件来做到这一点? 编辑:
文字
的大小和字
浏览 3
提问于2015-02-23
得票数 4
1
回答
使用AVFoundation
扫描
PDF
417条形码
、
、
、
我有一个工作的iOS条码
扫描
器使用新的AVFoundation条形码
扫描
类在iOS 7。我可以成功地获得一个一维条形码的字符串表示(例如,UPC条形码),但我也需要
扫描
二维
PDF
417条形码。我似乎不知道如何获得存储在
PDF
417条形码中的数据的字符串表示(或任何表示形式)。
扫描
器
识别
条形码并返回,但向该对象发送stringValue消息将返回零。文档中对该方法的描述如下: 此属性的值是通过
根据
机器可读代码的格式解码二进制有效载荷而创建的NSStri
浏览 12
提问于2013-11-28
得票数 3
回答已采纳
1
回答
如何从
PDF
文件中正确提取日文txt
、
我需要从
pdf
文件中提取文本。谁能给我一个如何处理的提示?
浏览 5
提问于2022-02-22
得票数 1
回答已采纳
0
回答
.net的tesseract OCR能处理
pdf
文件吗?
、
、
、
我想在png和
pdf
文件上执行光符
识别
。我能够获得png文件的Tesseract 3.0.2 .net包装器工作,但我找不到任何用于
PDf
files.So的类,它是否适用于
pdf
files.If不然后请让我知道
扫描
pdf
的任何其他开源库。我的需求是
扫描
特定圆的
pdf
格式的图表,并为这些圆创建超链接。
浏览 8
提问于2016-12-27
得票数 2
回答已采纳
1
回答
Windows
扫描
套件
、
我正在寻找一个
扫描
套件,我的Windows 10家庭笔记本电脑,我可以使用与我的Richo全合一。能够将多个页面
扫描
到一个
PDF
中OCR的能力,并创建一个
PDF
与可选择的文本。 我对免费的,甚至付费的软件开放。
浏览 0
提问于2017-07-25
得票数 4
1
回答
使用从
扫描
PDF
批量生成的OCR创建可搜索的
PDF
文件
、
其目标是自动将所有
扫描
文档转换为可搜索的
PDF
文件,而不仅仅是图像。
扫描
后的文档由
扫描
仪自动上传到Linux服务器上的共享文件中,作为
PDF
文件。该软件应该能够监视文件夹和自动OCR
扫描
的文件,并将
识别
的文本添加到
PDF
文件,使其可搜索。它还应该能够很好地处理多页
PDF
。Linux 在后台自动工作,不需要任何额外的手动步骤。能够以正确的方式将OCRed文本添加回
PDF
中(这样桌面搜索引擎就可以对其进行索引)
浏览 0
提问于2014-04-28
得票数 16
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
文字识别扫描,如何文字识别扫描出来?
免费文字识别扫描,有什么免费文字识别扫描
文字识别/图片识别/图片扫描
看完这几个文字识别扫描方法,就知道怎么进行文字识别扫描了
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券