腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(296)
视频
沙龙
3
回答
c#将
PDF
转换为Tif
、
我正在使用ghostscript转换
PDF
的Tif与C$类包装,然后是使用
光学
字符
识别
tessnet2读取图像文件的内容,但tif图像是相当不可读,图像是相当褪色的,看起来不正确,
光学
字符
识别
引擎无法读取任何东西有没有开放源码或库,可以花我几块钱就可以将
PDF
转换成高质量的TIf?或者任何可以读取
PDF
的开源
光学
字符
识别
引擎,因为tessnet2不能读取
PDF
。
浏览 6
提问于2012-08-31
得票数 0
回答已采纳
1
回答
保存并重新加载Abbyy的
光学
字符
识别
结果
、
、
、
假设我已经在Abbyy FindeReader中对多个
PDF
进行了
光学
字符
识别
。是否可以稍后在Abbyy FineReader中重新加载
光学
字符
识别
结果,以便纠正
光学
字符
识别
错误?
浏览 36
提问于2020-10-09
得票数 0
回答已采纳
2
回答
如何使用Tesseract从车辆的认证卡中获取文本区
、
、
我需要关于tesseract的建议。我尝试过使用Tesseract,但效果并不完美。很多信息都丢失了。我想扫描法国车辆的登记证书,我必须将数据恢复到数据库中。你可以在下面的文件中找到,这是一份法国注册证。是否有可能检测到本文档中的每个区域并将此信息保存在数据库中?我在网上读过,只用Tesseract是不可能检测到区域的?示例:如何恢复每个区域的文本并将其插入到数据库中?尼古拉斯
浏览 19
提问于2017-02-17
得票数 0
1
回答
从可搜索的
pdf
中读取,不带ocr
我目前正在使用扫描仪将我的
PDF
转换为可搜索的
PDF
。OCR已经处理好了,因为我可以在
PDF
中使用ctrl-f。 但是,我如何才能从我的程序中获取OCR的内容。
浏览 1
提问于2011-12-15
得票数 0
1
回答
谷歌翻译手机应用程序是否使用Tesseract在本地进行OCR?
、
、
、
、
与我在iOS上用Tesseract写的一个测试相比,这个应用程序在
光学
识别
方面超级快速和准确。所以我想知道: Google翻译手机应用程序是否使用Tesseract在本地进行OCR?
浏览 0
提问于2016-03-23
得票数 2
1
回答
如何从
PDF
中提取音乐符号?
、
、
、
我试图用另一种内置字体渲染
PDF
格式的音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
iconv.exe -f MAC
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
1
回答
Howto:使用C#在
光学
字符
识别
前提高
PDF
质量
、
、
、
一旦文件存在,该服务就会提取它,并将其转换为可读的
PDF
。在此过程中,该服务还会搜索条形码。在此之后,提取文本,并将文件及其文本存储到我们软件的数据库中。该位置基于条形码。现在,对于
光学
字符
识别
,我们使用了Atalasoft的SDK ()。此外,条形码
识别
器也包含在此SDK中。我测试了Kofax ()。我正在寻找类似的东西,但这可以使用某种SDK-kit在服务中实现。
浏览 2
提问于2011-07-06
得票数 5
回答已采纳
1
回答
我需要关于在网络上显示(和/或转换)
pdf
文件的建议
、
、
、
我们也想接受
PDF
,但我不确定显示
PDF
或将其转换为html的最佳方式是什么。或者,我们可以忘记直接显示
PDF
文件,而是像处理Word文档那样将它们转换为html,但我还没有遇到一个好看的库来实现这一点。最后一件事,我们计划为付费客户提供下载原始
PDF
文件的选项。这可能会很复杂吗?在构建流程的其余部分时,有什么是我应该牢记的吗?
浏览 2
提问于2012-03-24
得票数 3
1
回答
表单
识别
器OCR准确性问题
、
、
我正在尝试从扫描的身份证中提取数据,但遇到了
光学
字符
识别
准确性的问题。这是一些额外的小
字后
面的名字,这是混淆了身份证上的常规名称。表单
识别
器中的OCR不准确。有没有办法将新的3.0计算机视觉OCR API与表单
识别
器2.0一起使用?我看到一些文档,其中提到在容器中使用表单
识别
器时使用计算机视觉的API?如果我们使用云中的表单
识别
器API而不是本地容器,是否可以指定OCR API?
浏览 5
提问于2020-05-18
得票数 0
1
回答
Tabula-py解析
pdf
时出现字体错误tahoma
、
、
、
我试图用解析我的
pdf
,但是我得到了这个错误# from matplotlib import pyplot as pltfrom tabula import read_
pdf
_table# Converting first page into JPG with Image(filename="ed.
pd
浏览 4
提问于2016-10-13
得票数 1
1
回答
提取
PDF
中表示为图像的文本- itextsharp
、
、
、
我在使用ITextSharp从
PDF
文件中提取文本的过程中,我已经成功地提取了我感兴趣的文本的一部分,但当我继续我的‘文本’提取时,我注意到一些文本单词(当我使用itextsharp从整个页面提取整个文本时无法获得文本因此,简而言之:如何提取包含在
PDF
图像对象中的文本?我是否必须提取图像并找到另一种方法将其转换为文本?这是一个非常可怕的行星排列对我来说..有人遇到过这个问题吗?
浏览 4
提问于2013-06-07
得票数 2
回答已采纳
1
回答
查找没有文本的
PDF
、
、
我有很多文件夹与很多
PDF
,我想要
光学
字符
识别
那些没有文字层。所以首先,我想找到他们。我以为也许用pdfgrep的烟斗就能做好这份工作,但我迷路了。 如何找到没有文本的
PDF
?
浏览 0
提问于2021-01-15
得票数 5
回答已采纳
1
回答
SynFusion错误:无法加载文件或程序集Syncfusion.
Pdf
.Base,Version=16.4450.0.54
、
、
、
我已经安装了以下软件包以支持Docx和doc SynFusion.Licence Global.aspx enter image description here 项目15我已经安装了以下软件包,以支持
光学
字符
识别
文本enter image description here以前它是很好的工作与项目3,以支持Docx和文档到enter image description here,但现在我已经安装了
光学
字符
识别
同步文件后安装
光学
字符
识别
同步文件到
Pdf
不工作,不知何故,我
浏览 60
提问于2019-03-20
得票数 0
回答已采纳
1
回答
如何使用Java从
PDF
中的特定矩形区域提取数据?
、
我试图从
PDF
中给定的两个坐标指定的特定矩形区域中提取数据。是否可以在
PDF
中执行此操作,或者我是否必须将其转换为图像并使用OCR?如果有,PDFBox或iText是否包含通过
光学
字符
识别
来分析图像的方法?谢谢!
浏览 26
提问于2017-12-26
得票数 3
回答已采纳
2
回答
如何使用谷歌的AutoML进行
光学
字符
识别
、
、
、
但是我在AutoML上找不到任何与
光学
字符
识别
相关的东西。是否可以使用AutoML进行
光学
字符
识别
?我们该怎么做呢?我知道这是一个非常开放的问题,但我希望能得到一些帮助。
浏览 32
提问于2020-06-25
得票数 0
回答已采纳
1
回答
tesseract 3.03 -输入jpg文件
、
、
我想创建一个具有可选/可搜索文本的
PDF
。我有在
光学
字符
识别
之前经过一些预处理的source.png,然后我有view.jpg,这是一个压缩版本的source.png,以减少输出的
PDF
文件 如何在语法中定义view.jpg?tesseract -l eng source.png out
pdf
浏览 3
提问于2014-03-03
得票数 0
1
回答
有没有办法使用applescript (或elsescript) acrobat XI来执行OCR?
、
、
我的最终目标是设置一个关注的文件夹与黑泽自动
光学
字符
识别
每一个我放入的
PDF
文件,请不要告诉我使用PDFPen,我不喜欢它,我只是喜欢
光学
字符
识别
的特殊能力的Acrobat ;-) 谢谢。
浏览 4
提问于2013-02-05
得票数 0
10
回答
光学
字符
识别
软件推荐?
我想直接扫描的版本一定是由一些
光学
字符
识别
软件处理的。谢谢和问候! 请每个答案限制一个软件。
浏览 0
提问于2010-10-22
得票数 15
回答已采纳
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
无法对tiff和jpeg文件执行OCR
我指的是在tiff和jpeg文件上执行
光学
字符
识别
的“”,而是说“找不到尾部字典”,“无法读取外部参照表”,“异常失败(”错误: pdfinfo无法确定页数。检查
pdf
输入文件。\n“)”虽然从jpeg或tiff文件到
PDF
文件的转换工作正常,并且
PDF
文件在alfresco共享页面上可见“,但没有OCR正在处理这些tiff和jpeg文件
浏览 1
提问于2017-06-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
安装算量识别文字后怎么用?
文字识别与光学字符识别有什么区别?
PDF文字识别软件哪个好?试试这些PDF识别软件吧
怎么识别pdf中的文字?这有pdf的文字识别方法
PDF文字识别怎么做?教你几分钟快速识别PDF文档
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券