转换ocr - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

将pdf转换为txt

、、、

我试图将pdf转换成的文本。基本上，他们有20k+页面的电子邮件打印从Outlook，然后扫描为..pdf。(讨厌，我知道。)我已经尝试过各种工具，比如Tesseract (直接的，也包括在用.pdf将.tif转换成ImageMagik之后)，我只得到了一堆gobbledeegook。有没有人对如何处理这些文件有其他建议？

浏览 3提问于2016-02-13得票数 0

回答已采纳

1回答

对Tesseract的最佳分辨率-OCR

、、、

什么是最好的tif图像分辨率的OCR？我刚刚转换了一个OCR-PDF使用幽灵脚本，决议1200给出更好的转换为文本。

浏览 4提问于2013-09-01得票数 0

回答已采纳

1回答

高新ECM含量转换

我使用Alfresco将TIFF转换为PDF，使用Tiger OCR库()<?bean> </property></beans> 当我将TIFF文件导入到“公司主页”文件夹中时，我现在希望将该内容转换为现在，假设转换是自动的，还是需

浏览 1提问于2011-04-15得票数 0

1回答

扫描pdf至doc

有没有人知道是否有一个免费的在线OCR转换器，可以转换大扫描的pdf文件(例如，我想转换一个扫描的28 of大小的pdf文档)？我试过很多ocr转换器，但都失败了。

浏览 0提问于2016-01-17得票数 0

2回答

将文本从图像转换为文本文件

、

我有一个图像，我想把它转换成文本文件，以便在文字处理软件中使用。1)它可以在任何软件中完成吗？2)是否可以用Matlab或任何其他语言编写程序，将其转换为文本。图像文件中的字体真的很差。

浏览 1提问于2016-10-28得票数 0

1回答

带有OCR松散OCR的ps2pdf

我已经寻找了大量的时间来转换ps2pdf与OCR。所发生的事失去了OCR。如何将OCRed pdf转换为Post脚本文件，然后返回到Post后脚本文件？

浏览 1提问于2020-05-26得票数 1

回答已采纳

4回答

如何使用Java获取png文件中的文本

、、

我想检查图像中是否存在特定的字符串。这有可能吗？能做到吗？

浏览 0提问于2010-12-20得票数 3

回答已采纳

1回答

从流访问图片盒

、

如何从代码的picturebox1 = img位访问ocr.Image。如果我使用但很明显，这不是我要取得的成就。错误是： private void timer1_Tick(obj

浏览 2提问于2017-11-27得票数 0

回答已采纳

2回答

如何将pdf格式转换为eBook格式

、

是否有方法将PDF文档转换为eBook格式，如epub、azw或mobi？我正在寻找一个应用程序，这是快速的转换。我刚试过口径。10分钟后，甚至没有达到2%的转换。所以请不要有口径。CLI是首选。

浏览 0提问于2013-04-26得票数 9

回答已采纳

2回答

echo exec("convert ddd.jpg ddd.png");如果我在命令行上运行它，它是有效的，但是对于php，给我这个。我还检查了phpinfo()，在环境路径上没有imageMagick。但是我已经通过自动构建添加了环境路径。我觉得问题出在phpinfo()环境路径上没有显示路径我的服务器是windows server 2008，使用的是IIS，php5.6exec('"c:\Program Files\ImageMagi

浏览 0提问于2016-04-12得票数 0

1回答

在尝试解析具有文本包含图像的pdf时使用Apache tika解析器的问题

、、、、

我使用这两个依赖项：- tika核心2.6.0tika解析器标准包2.6.0 .Parsing在这些情况下很好地工作：- pdf文件和文本。pdf文件与图像。文本文件和其他扩展名。有人能在这里建议如何解决失败的案件吗？谢谢org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:312) ~org.apache.tika.tika-core-2.6.0.jar:2.6.0 at org.apache.tika.pars

浏览 19提问于2022-11-11得票数 0

1回答

将扫描的pdf文件转换为文本可搜索的pdf文件

、、

我想将扫描的pdf文件转换为可文本搜索的pdf文件。我想给出一个输入作为扫描的PDF，然后我的预期输出是可搜索的PDF。请帮助我给任何开放源代码的网络api或付费网络api服务的链接，或任何工具，可以转换为文本搜索的pdf文件。我在我的web应用程序中使用PHP语言。

浏览 25提问于2017-07-09得票数 1

1回答

AttributeError:模块“ocrmypdf”没有属性“ocr”

、、

我正在使用ocrmypdf库将扫描的pdf转换成可搜索的pdf，但我得到了这个错误。这是我目前正在运行的代码ocrmypdf.ocr('/content/drive/MyDrive/Dataset 2020/OCR/1081975.pdf', 'output.pdf')AttributeError: module 'ocrmypdf' has no attribute

浏览 5提问于2020-11-24得票数 1

回答已采纳

1回答

如何使用python解析类中的嵌套json

、、

RowCol] SaveImageResult: bool OCR_ROI: List[Item]{ "description": "string", {] ] 但是，我想要的数据具有相同的键，但值不

浏览 0提问于2021-05-05得票数 0

1回答

OCR中的格鲁吉亚语

、

我在将包含文本图像的JPG文件转换为文本文件时遇到问题。我尝试了ABBYY的OCR SDK和其他一些OCR来源，但它们都不包含乔治亚语。您能告诉我有没有可以用于格鲁吉亚语言的OCR源？

浏览 2提问于2013-08-20得票数 4

1回答

如何将jpg文件目录转换为以文件名为书签的pdf？

、、

如何将它们转换为一个将文件名作为书签的pdf文件？ (我最终也想加入ocr。如前所述，我们可以使用.jpg将.pdf文件转换为img2pdf .jp --output combined.pdf，然后可以使用ocrmypdf combined.pdf combined_ocr.pdf添加ocr。

浏览 0提问于2021-09-23得票数 0

1回答

Windows OCR引擎无法识别画布(转换为位图)中的文本

、、、、

这是一个简单的画布对象，我想让将其转换为文本。我正在努力将画布数据转换成OCR引擎支持的软件位图。因此，我设法获得了流，但不幸的是，OCR无法识别它。 var blob = canvas.msToBlob(); // This is the stream

浏览 0提问于2016-03-12得票数 0

9回答

什么是最好的，最简单的OCR解决方案？

、、

我想通过简单的扫描将它们转换成图像，然后使用OCR将它们转换为文本。有一个好的OCR应用程序的图形用户界面，将给我一个好的结果按下一个按钮？

浏览 0提问于2010-12-05得票数 97

回答已采纳

1回答

配置OCR JAVA Asprise

、

我想使用一种将图像转换为文本(OCR)的方法。import com.asprise.util.ocr.OCR; public static void main(String[] args) throwsjava.lang.Runtime.loadLibrary0(Unknown Source) at com.asprise.util.ocr.<em

浏览 4提问于2013-05-15得票数 3

2回答