腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
OCR
能否
识别
视频
里
的
文字
?
浏览 199
提问于2022-06-15
1
回答
帮助Canon CanoScan LiDE扫描
PDF
文档
、
、
、
在过去
的
10天
里
,我刚刚开始使用Ubuntu,打算永久停止使用Windows。到目前为止已经很棒了。我已经用可用
的
Ubuntu应用程序和Google
的
一些帮助替换了几乎所有的Microsoft应用程序。 我
的
佳能CanoScan LiDE 110扫描仪出了问题。当我使用Windows 7中
的
扫描仪,并将扫描过
的
书籍页保存为
PDF
格式时,我可以打开
PDF
扫描页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
2
回答
可将
OCR
文本插入回源
PDF
的
OCR
库
、
是否有库(或可执行文件)可以
OCR
PDF
(通常是通过扫描纸张创建
的
PDF
),并将
识别
出
的
文本重新注入到
PDF
中?很可能是扫描图像背后
的
隐形
文字
。 最好是开源
的
。(目标:我有一个巨大
的
由Lucene索引
的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关
的
。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
关于拆分
PDF
和
OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过
的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。哪种编程语言和库给了我最大
的
灵活性来完成这样
的
任务,而不需要我做所有繁琐
的
工作。我对Python很熟悉。我知道Python
的
PDF
和
OCR
库,但我找不到任何关于拆分单个页面的内容。然后,最后希望将
pdf
页面的拆分部分传递给
OCR
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
如何在PDFTextExtractor上使用iTextSharp
我想用iTextSharp从
pdf
文件中检索文本。但是,我无法像在itextsharp(itext)
的
JAVA中那样使用PDFTextExtractor。我需要readPDFOffline类返回文件
的
内容。我会给你下面的伪,让你很好地理解我想要什么。私有字符串readPDFOffline(string fileUri);检索此
Pdf
的
文本内容;*返回contentOfflineFile; 我想做代码
的<
浏览 3
提问于2010-12-10
得票数 3
回答已采纳
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我
的
问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
如何从
PDF
中提取音乐符号?
、
、
、
我试图用另一种内置字体渲染
PDF
格式
的
音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
1
回答
OCR
表格
识别
是否支持Excel表格合并?
浏览 157
提问于2022-06-15
2
回答
天成文书(印地语/马拉地语/梵语)
的
OCR
、
、
、
、
有谁知道最近使用现代机器学习技术在印度
文字
光学字符
识别
方面所做
的
任何工作?我知道加尔各答
的
三军情报局正在做一些研究,但据我所知,在过去
的
3-4年
里
没有什么新
的
东西出现,可悲
的
是,天成字
的
OCR
是缺乏
的
!
浏览 0
提问于2010-01-17
得票数 8
回答已采纳
1
回答
使用Python PyPDF2从扫描
的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描
的
PDF
中提取文本(具有不可选文本
的
图像)。我想要
的
信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
是否可以使用Google脚本将位于Google中
的
不可搜索
的
PDF
转换为可搜索
的
PDF
?
、
、
、
我想使用Google 将不可搜索
的
PDF
转换成可搜索
的
PDF
,其中
的
文本是覆盖在
PDF
上
的
。
PDF
位于我
的
谷歌驱动器,我不想上传文件到另一个网站或下载
的
文件,以进行转换。我没有找到任何显示文本可以被覆盖
的
资源,类似于Acrobat如何进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们转换成文本或文档文件。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
1
回答
OCR
文字
识别
?
浏览 169
提问于2022-06-15
8
回答
OCR
文字
识别
技术有哪些应用?
OCR
是实时高效
的
定位与
识别
图片中
的
所有
文字
信息,返回
文字
框位置与
文字
内容。支持多场景、任意版面下整图
文字
的
识别
,以及中英文、字母、数字
的
识别
。简单来说就是将图片上
的
文字
内容,智能
识别
成为可编辑
的
文本,这么强大
的
功能在我们生活当中有哪些应用呢?
浏览 3646
提问于2018-08-24
1
回答
人脸核身
的
费用中包含
OCR
身份证
识别
吗?
、
浏览 156
提问于2022-06-15
2
回答
Tesseract
OCR
混淆了0到8
的
斜线
、
、
我曾在终端字体上训练过tesseract,但无论如何,我都无法让它
识别
出0。我正在使用jTessEditor创建培训tif和框。即使在验证时,它也会将所有的0读为8s。我遗漏了什么吗?下面是0
的
一个示例,它将其读取为8:我使用以下参数: --psm 10 -c tessedit_char_whitelist=0123456789# --oem 3 -l terminus
浏览 8
提问于2018-10-31
得票数 22
1
回答
文字
识别
能否实现全书某个关键词搜索?
浏览 136
提问于2022-06-15
1
回答
腾讯云
文字
识别
和腾讯优图
文字
识别
?
请问腾讯云官网
的
文字
识别
和腾讯优图网站上
的
OCR
文字
识别
有什么区别啊,这两个接口调用
的
好像不一样?
浏览 654
提问于2020-03-30
3
回答
文字
识别
OCR
接口本地图片下载失败?
、
、
、
用
文字
识别
OCR
的
Python接口调用来对本地图片进行
识别
,报错“下载失败”,FailedOperation.DownLoadError message:下载失败。参照这个官方样例https://github.com/TencentCloud/tencentcloud-sdk-python/blob/master/examples/
ocr
/v20181119/general_fast_<e
浏览 1648
提问于2020-03-07
3
回答
手写表单,怎么定位
识别
区域。每张图片像素大小都不确定?
如何
识别
表单中
的
特定区域手写汉字。
浏览 743
提问于2018-04-17
1
回答
人脸核身支持护照
识别
吗?
浏览 246
提问于2022-06-15
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
[windows] Umi-OCR 免费 · 离线 · 文字识别软件 支持PDF识别 开源
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
OCR-文字识别
OCR文字识别工具
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券