腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
python
、
python-imaging-library
、
data-extraction
、
pypdf2
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
2
回答
如何用谷歌翻译
图片
上的文字?
google-translate
如果我遇到一个含有未知文本的
图片
文件,我可以为它拍另一张照片,然后用我的手机使用进行翻译,但我如何在我的电脑上翻译它呢?我试着输入谷歌翻译的
图片
链接,但显示无法打开文件。
浏览 18
提问于2014-08-06
得票数 0
回答已采纳
1
回答
从
PDF
中获取树的文件(最好使用Python)
python
、
pdf
、
tree
、
nlp
、
extraction
我想制作一系列文件,其中包含了这个
PDF
()中的树。文件的名称将是左边对应的树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。我怎样才能从这个
PDF
中获取我想要的文件呢?能用Python完成吗?还有更简单的方法吗?或者,我获得
PDF
的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4#r#h NP#1#5#l#s NP
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
3
回答
快速在线
OCR
工具
web-apps
、
ocr
我的一个同事刚发了一份他正在写的东西的草稿.作为一种形象!我如何快速地将其转换成实际文本,而不需要安装任何东西、注册或等待数小时?
浏览 0
提问于2014-02-06
得票数 7
回答已采纳
1
回答
从
PDF
中提取文本在R中返回奇怪的结果
r
、
pdf
、
text-mining
我试图从一堆
PDF
文件中挖掘文本,但当我使用pdftools包中的
pdf
_text将它们读取到R中时,它产生的文本就是奇怪的,与
PDF
文件中的实际内容完全不同。link驱动器链接:。下面是我使用的示例代码:
pdf
1 <-
pdf
_text("https://dl.dropboxusercontent.com/s/308gpdijvnw18mf/2018REQ118030709.
pdf
?
浏览 14
提问于2018-03-03
得票数 3
回答已采纳
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
pdf
、
applescript
、
ocr
、
acrobat
、
automator
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
支持
OCR
的
pdf
到C#
c#
、
pdf
、
acrobat
我正在使用acrobat sdk将
图片
pdf
转换为可搜索的文本
pdf
,有谁能帮我吗,我卡住了,我需要检查文件是否已经是
OCR
了??
浏览 2
提问于2012-09-20
得票数 1
11
回答
免费的
OCR
软件,使
PDF
可搜索(与可搜索的文本在正确的地方)
windows
、
gratis
、
linux
、
pdf
、
ocr
是否有任何免费的
OCR
软件(用于Linux和/或Windows)可以像Acrobat那样将
PDF
扫描文档作为输入并输出可搜索的
PDF
?使用可搜索的
PDF
格式,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。我知道Linux上的gscan2
pdf
可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景扫描页面上的文本完全不同步。这是因为gscan2
pdf
将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或小段落发送到<em
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
java
、
php
、
macos
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
1
回答
Ocr
表格识别V2支持的
图片
格式和大小?
文字识别
浏览 242
提问于2022-06-15
2
回答
用
OCR
将文本文档扫描到
PDF
pdf
、
ocr
、
scanning
我需要扫描文本文件到
PDF
。操作系统Windows或Linux。预算-无限。
浏览 0
提问于2016-10-03
得票数 2
2
回答
将图像类型
PDF
转换为启用
OCR
的
PDF
image
、
pdf
、
text
、
ocr
我被要求开发一个小应用程序,有人可以上传
PDF
到网站。该网站是用ASP的经典编码,但我不介意沿着.net的路线。上传完后,代码需要检查
PDF
是否基于文本,如果不是,则需要将文档转换为
PDF
文本类型。 有没有人有一个组件的想法,可以执行此图像
PDF
文本
PDF
转换?
浏览 2
提问于2011-12-15
得票数 2
回答已采纳
2
回答
是否可以将
PDF
作为HTML嵌入到电子邮件中?
c#
、
asp.net
基本上,我有一个
PDF
,要么想帧它或转换成HTML,并在电子邮件中显示它。我还没有找到一个可行的解决方案。<object data="MyPDF.
pdf
" type="application/
pdf
" width="100%" height="100%"></object>
浏览 0
提问于2011-11-05
得票数 2
回答已采纳
5
回答
如何在扫描的.jpeg中编辑文本?
software-recommendation
、
pdf
、
scanning
、
ocr
我需要上传一个扫描图像作为
PDF
文件。我以前从来没有这样做过,所以我真的被困住了。我该怎么做?
浏览 0
提问于2012-12-05
得票数 15
回答已采纳
5
回答
是否有
OCR
无法识别的字体?
ocr
为此,我将其页面转换为
图片
,并将其添加回
PDF
文件。主要的问题是,任何
OCR
程序都可以恢复整个书面文本,特别是页面将是清晰的(而不是扫描的书),这将提高
OCR
的准确性。那么,有没有
OCR
无法识别的字体呢?否则,有没有一种技术可以让我的文档只被人类阅读,而不被
OCR
识别?(例如,添加特定的背景,等等) 提前谢谢你。
浏览 3
提问于2012-11-13
得票数 4
回答已采纳
2
回答
如何用魔杖改变
图片
的对比度?
python
、
ocr
、
tesseract
、
python-tesseract
、
wand
下面的
图片
用在Tesseract
OCR
上:我处理
图片
的代码是:with image[450:6200, 840:3550] as cropped: image = Image.open(io.BytesIO(imageBlob))虽然我的
OCR
有时会混淆和复制8与3,并返回07:
浏览 5
提问于2020-01-07
得票数 1
回答已采纳
2
回答
使Tess4J从
PDF
文件中获取图像
java
、
parsing
、
pdf
、
tesseract
如何让Tess4J从
PDF
文件中获取图像?我用Asprise测试了这个例子,但我在Tess4J上找不到任何这样的例子import com.asprise.util.
ocr
.
OCR
;
浏览 0
提问于2013-05-16
得票数 0
回答已采纳
1
回答
在终端中运行命令,并在输出中包含输入名
terminal
、
filenames
、
command
、
kubuntu
、
ocr
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
在r中的
pdf
上执行
ocr
时出错
r
、
pdf
、
ocr
、
tesseract
、
lapply
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
1
回答
示例标注工具
OCR
文本检测问题
ocr
、
microsoft-cognitive
、
form-recognizer
我有一个关于Azure Form Recognizer的手写文本
OCR
的问题。 在Azure的示例标签工具中添加标签之前,在手写
PDF
文件上运行
OCR
时,
OCR
通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”
OCR
。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖
OCR
文本并输入正确文本的方法。 有没有一种方法可以自己输入
OCR
检测不到或检测不正确的文本?
浏览 37
提问于2020-07-15
得票数 1
回答已采纳
点击加载更多
相关
资讯
OCR图片转文字软件Umi-OCR,图片文字识别离线版软件,免费开源
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
PDF小工具支持合并、拆分、PDF转图片、图片提取、图片转PDF
图片文字识别与翻译OCR应用:白描
如何使用OCR软件识别手写图片文字?
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券