图片型pdf ocr - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

使用Python PyPDF2从扫描的pdf (图像)中提取文本

python、python-imaging-library、data-extraction、pypdf2

我一直在尝试从扫描的PDF中提取文本(具有不可选文本的图像)。我想要的信息，包含日期，发票编号从pdf链接()。from PIL import Imagepage = pdf_reader.getPage

浏览 2提问于2020-05-27得票数 1

回答已采纳

2回答

如何用谷歌翻译图片上的文字？

google-translate

如果我遇到一个含有未知文本的图片文件，我可以为它拍另一张照片，然后用我的手机使用进行翻译，但我如何在我的电脑上翻译它呢？我试着输入谷歌翻译的图片链接，但显示无法打开文件。

浏览 18提问于2014-08-06得票数 0

回答已采纳

1回答

我想制作一系列文件，其中包含了这个PDF ()中的树。文件的名称将是左边对应的树号(t0、t1等)。我试图使用python提取相关信息和树，但我遇到了麻烦。我怎样才能从这个PDF中获取我想要的文件呢？能用Python完成吗？还有更简单的方法吗？或者，我获得PDF的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4#r#h NP#1#5#l#s NP

浏览 0提问于2018-09-20得票数 0

回答已采纳

3回答

快速在线OCR工具

web-apps、ocr

我的一个同事刚发了一份他正在写的东西的草稿.作为一种形象！我如何快速地将其转换成实际文本，而不需要安装任何东西、注册或等待数小时？

浏览 0提问于2014-02-06得票数 7

回答已采纳

1回答

从PDF中提取文本在R中返回奇怪的结果

r、pdf、text-mining

我试图从一堆PDF文件中挖掘文本，但当我使用pdftools包中的pdf_text将它们读取到R中时，它产生的文本就是奇怪的，与PDF文件中的实际内容完全不同。link驱动器链接：。下面是我使用的示例代码：pdf1 <- pdf_text("https://dl.dropboxusercontent.com/s/308gpdijvnw18mf/2018REQ118030709.pdf?

浏览 14提问于2018-03-03得票数 3

回答已采纳

1回答

Applescript或Automator:运行Acrobat对OCR多个PDF文件进行批处理，更多

pdf、applescript、ocr、acrobat、automator

我使用ScanSnap S1500M将所有纸质文档扫描到/PDF-S1500M/-我想使用对文本进行OCR。我想(每天)自动化这个过程：我应该用自动售货

浏览 5提问于2011-08-18得票数 1

回答已采纳

1回答

支持OCR的pdf到C#

c#、pdf、acrobat

我正在使用acrobat sdk将图片pdf转换为可搜索的文本pdf，有谁能帮我吗，我卡住了，我需要检查文件是否已经是OCR了？？

浏览 2提问于2012-09-20得票数 1

11回答

免费的OCR软件，使PDF可搜索(与可搜索的文本在正确的地方)

windows、gratis、linux、pdf、ocr

是否有任何免费的OCR软件(用于Linux和/或Windows)可以像Acrobat那样将PDF扫描文档作为输入并输出可搜索的PDF？使用可搜索的PDF格式，我的意思是OCRed文本在原始文本上是不可见的，可以用鼠标选择并复制。我知道Linux上的gscan2pdf可以这样做，但是文本被放置在页面的左上角，而且太小了，与背景扫描页面上的文本完全不同步。这是因为gscan2pdf将整个页面提供给OCR引擎。它应该将图像分解成小图像，用单行文本或小段落发送到<em

浏览 0提问于2014-04-20得票数 72

回答已采纳

4回答

运行反引号/exec()时的PHP路径问题

java、php、macos

即$f = `java -jar /OCR/ocr.jar /Folder/$path /ocr/output.txt`;java -jar /OCR/ocr.jar /Folder/Sub\ Folder/filetoocr.pdf /

浏览 1提问于2010-04-15得票数 0

1回答

Ocr表格识别V2支持的图片格式和大小？

文字识别

浏览 242提问于2022-06-15

2回答

用OCR将文本文档扫描到PDF

pdf、ocr、scanning

我需要扫描文本文件到PDF。操作系统Windows或Linux。预算-无限。

浏览 0提问于2016-10-03得票数 2

2回答

将图像类型PDF转换为启用OCR的PDF

image、pdf、text、ocr

我被要求开发一个小应用程序，有人可以上传PDF到网站。该网站是用ASP的经典编码，但我不介意沿着.net的路线。上传完后，代码需要检查PDF是否基于文本，如果不是，则需要将文档转换为PDF文本类型。有没有人有一个组件的想法，可以执行此图像PDF文本PDF转换？

浏览 2提问于2011-12-15得票数 2

回答已采纳

2回答

是否可以将PDF作为HTML嵌入到电子邮件中？

c#、asp.net

基本上，我有一个PDF，要么想帧它或转换成HTML，并在电子邮件中显示它。我还没有找到一个可行的解决方案。<object data="MyPDF.pdf" type="application/pdf" width="100%" height="100%"></object>

浏览 0提问于2011-11-05得票数 2

回答已采纳

5回答

如何在扫描的.jpeg中编辑文本？

software-recommendation、pdf、scanning、ocr

我需要上传一个扫描图像作为PDF文件。我以前从来没有这样做过，所以我真的被困住了。我该怎么做？

浏览 0提问于2012-12-05得票数 15

回答已采纳

5回答

是否有OCR无法识别的字体？

ocr

为此，我将其页面转换为图片，并将其添加回PDF文件。主要的问题是，任何OCR程序都可以恢复整个书面文本，特别是页面将是清晰的(而不是扫描的书)，这将提高OCR的准确性。那么，有没有OCR无法识别的字体呢？否则，有没有一种技术可以让我的文档只被人类阅读，而不被OCR识别？(例如，添加特定的背景，等等) 提前谢谢你。

浏览 3提问于2012-11-13得票数 4

回答已采纳

2回答

如何用魔杖改变图片的对比度？

python、ocr、tesseract、python-tesseract、wand

下面的图片用在Tesseract OCR上：我处理图片的代码是：with image[450:6200, 840:3550] as cropped: image = Image.open(io.BytesIO(imageBlob))虽然我的OCR有时会混淆和复制8与3，并返回07:

浏览 5提问于2020-01-07得票数 1

回答已采纳

2回答

使Tess4J从PDF文件中获取图像

java、parsing、pdf、tesseract

如何让Tess4J从PDF文件中获取图像？我用Asprise测试了这个例子，但我在Tess4J上找不到任何这样的例子import com.asprise.util.ocr.OCR;

浏览 0提问于2013-05-16得票数 0

回答已采纳

1回答

在终端中运行命令，并在输出中包含输入名

terminal、filenames、command、kubuntu、ocr

我在Dolphin服务菜单文件中有这一行，该文件包含用于PDF处理的许多其他命令：它的优点是提供表单MY_PDF_ocr.pdf的输出文件，从而保留输入文件的名称。为此，我可以用这句话： Exec=konsole --noclose -e ocrmypdf "%u&

浏览 0提问于2022-11-30得票数 0

回答已采纳

1回答

在r中的pdf上执行ocr时出错

r、pdf、ocr、tesseract、lapply

在r中的pdf上尝试OCR，这给了我错误。运行代码后，也会生成"i.txt“文件，但仍然会出现错误。'"D:/Software_for_PDF_OCR/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/PDF_OCR_File/test.pdf -f 1 -lD:/PDF_OCR_File/t

浏览 3提问于2017-09-20得票数 0

1回答

示例标注工具OCR文本检测问题

ocr、microsoft-cognitive、form-recognizer

我有一个关于Azure Form Recognizer的手写文本OCR的问题。在Azure的示例标签工具中添加标签之前，在手写PDF文件上运行OCR时，OCR通常会错误地检测文本。对于其他表单分析和提取技术，通常提供一个选项来输入应该被检测到的文本，以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer，我看不到一种覆盖OCR文本并输入正确文本的方法。有没有一种方法可以自己输入OCR检测不到或检测不正确的文本？

浏览 37提问于2020-07-15得票数 1

回答已采纳

点击加载更多