腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
关于拆分
PDF
和OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我对
Python
很熟悉。我知道
Python
的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别
字符并将输出转换为csv或文本文件。
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
2
回答
Acrobat XI Pro喜欢
pdf
阅读器
、
、
我如何安装一个
PDF
阅读器,像“杂技XI专业”,让我突出文本,有
文字
识别
,让我组合和转换
PDF
格式和其他格式?
浏览 0
提问于2015-02-02
得票数 0
1
回答
查找没有文本的
PDF
、
、
我有很多文件夹与很多
PDF
,我想要光学字符
识别
那些没有
文字
层。所以首先,我想找到他们。我以为也许用pdfgrep的烟斗就能做好这份工作,但我迷路了。 如何找到没有文本的
PDF
?
浏览 0
提问于2021-01-15
得票数 5
回答已采纳
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中的文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中的文本。 所有都是一样的,
浏览 1
提问于2019-03-07
得票数 0
2
回答
可将OCR文本插入回源
PDF
的OCR库
、
是否有库(或可执行文件)可以OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
将置乱的
PDF
字符重映射为可读的文本
、
、
、
我确实有一个问题,因为cups-
PDF
创建
PDF
文档,其中字符映射到奇怪的符号[在Ubuntu 14.04和16.04}。我认为这是某种unicode,即使
Python
告诉我它的字符串类型。type(object)
python
返回"string" 如果我从
PDF
中获取文本,通过鼠标复制粘贴,或者通过
Python
模块,或者通过
Python
模块。因此,它的真实,
PDF
有破坏文本信息,这是正确的
PDF
文档本身。我不知道
浏览 1
提问于2017-04-18
得票数 0
回答已采纳
1
回答
从
PDF
文件中提取文档信息,比如页边距宽度?
我使用了qpdf和pdfinfo等工具从poppler获得有关
PDF
文档的信息。然而,我正在寻找一种方法,以获得更具体的信息,如宽度的边距,字体家族使用的,等等。然而,qpdf有一个--json选项,它将
PDF
转换成它的JSON表示形式。我对JSON非常熟悉,但是找不到任何叫做“边距”或“字体-家庭”的属性。这样的信息是否以
PDF
格式记录?我不确定这个问题是否适合这个板或StackOverflow,因为如果有一些编程方法来提取这些信息(比如C或
Python
),我也愿意使用它们。有什么建议吗?现在,我必须使用
PDF
浏览 0
提问于2021-09-14
得票数 1
2
回答
除
PDF
以外的所有文件链接的JS RegEx
、
我正在尝试匹配HTML文档中包含特定文件夹链接的所有href属性,而不是
PDF
。我很难让它匹配,我有一个可以得到所有
PDF
的:但我排除
PDF
的尝试并没有让我走得太远。有没有办法做我想要的,或者我只是匹配所有的文件而不是使用条件语句来检查它是否是
PDF
?谢谢! 达伦
浏览 1
提问于2013-06-04
得票数 0
2
回答
柬埔寨字母表上的交货单
、
、
我得到了一个问题与Prestashop 1.7.4.2交货单,它不能
识别
高棉
文字
母。有谁可以帮助我用哪种字体来显示这些字母? 我已经在\override\classes\
pdf
\PDFGenerator.php中添加了支持的字体,但它不起作用。
浏览 1
提问于2020-06-10
得票数 2
1
回答
os.walk是否适用于非转义反斜杠?
、
只是在我正在写的一小段代码中发现了一个bug,而实际上并没有bug?print('The current folder is ' + folderName) print('SUBFOLDER OF ' + folderName + ': ' + subfolder) print(
浏览 19
提问于2016-09-12
得票数 0
回答已采纳
2
回答
Python
2.7:在Windows 7中使用pypdfocr有困难
、
、
我试图在Windows7和
Python
2.7中使用pypdfocr。 我似乎错过了Poppler或XPDF,但我确实按照的建议通过安装了Popple
浏览 2
提问于2017-03-17
得票数 2
1
回答
Python
手写
识别
软件?
有没有
Python
手写
识别
库?手写
识别
包、.jpg图像、.
pdf
图像的输入是什么?
浏览 0
提问于2010-05-22
得票数 4
2
回答
用
python
打开不带文本的
pdf
、
我希望为Django视图打开一个
PDF
,但是我的
PDF
没有文本,
python
返回给我一个空白
PDF
。在每一页上,这是对一个页面的扫描: with open(path) as
pdf
: response = HttpResponse(
pdf
.read(),content_type='application/
浏览 1
提问于2018-09-17
得票数 0
回答已采纳
1
回答
使用Java和Itext编辑
PDF
文本
、
有办法编辑
PDF
文档文本吗?比如找到和替换特定的文本?我能够编辑特定坐标(x,y)的
pdf
,但无法
识别
和替换。我看到的所有库都是从零开始创建的
PDF
和小的编辑功能。不管怎样,我可以用itext编辑上面的解释吗?请advise...thank你! **例子:一份
pdf
文件载有以下的副翼。是最古老的古希腊和拉丁文,在单词或其他
文字
之间几乎没有空格,可以用boustrophed
浏览 5
提问于2014-07-10
得票数 2
3
回答
文字
识别
OCR接口本地图片下载失败?
、
、
、
用
文字
识别
OCR的
Python
接口调用来对本地图片进行
识别
,报错“下载失败”,FailedOperation.DownLoadError message:下载失败。参照这个官方样例https://github.com/TencentCloud/tencentcloud-sdk-
python
/blob/master/examples/ocr/v20181119/general_fast_ocr.py
浏览 1570
提问于2020-03-07
1
回答
OCR可以
识别
PDF
文件吗?
浏览 178
提问于2022-06-15
3
回答
不创建文件将
pdf
转换为文本
、
、
我想从一个网站下载
pdf
文件和
文字
工作。但是,我不想创建一个
pdf
文件,然后将其转换为文本。我使用
python
请求。有什么方法可以直接在下面的代码之后得到文本吗?
浏览 1
提问于2017-11-12
得票数 0
回答已采纳
1
回答
在组织模式代码块导出中显示纠缠的文件名
、
、
我正在Emacs组织模式下进行
文字
编程。当我将Latex导出到
pdf
时,我希望每个代码块都显示代码纠缠到的文件的名称。我在中找不到合适的头参数。这是我的组织文件:#+BEGIN_SRC
python
:tangle pythontest.py#+END_SRC这是我的.emacs: 'org-babel-load-languages '(
浏览 5
提问于2016-08-10
得票数 3
1
回答
文字
识别
如何使用?
浏览 570
提问于2020-01-11
2
回答
如何将
python
添加到CMD?
、
读作“
python
”的中
文字
不能
识别
为内部或外部命令可操作程序或批处理文件。我对编程完全是个新手。你的帮助对我意义重大。提前谢谢你。 (C:\Users\User\AppData\Roaming\Microsoft\Windows\Start菜单\程序\
Python
3.7)
浏览 1
提问于2018-07-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎么识别pdf中的文字?这有pdf的文字识别方法
pdf文字识别,教你一个提取pdf文字的方法
PDF文字识别软件哪个好?试试这些PDF识别软件吧
技术教程:2个Python程序识别图片和pdf上的文字!
如何识别pdf中的文字,几步教你轻松识别
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券