腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
poppler
来
提取
注释
。
g_free
() /
get_color
()
问题
、
、
、
我借用了这段python代码 ( enno groper的第一个回答)来自动化从pdf中
提取
批注。 我想对代码做一些修改。尝试
使用
annot_mapping.annot.get_color()获取
注释
的颜色时,我遇到了第一个
问题
。根据,
poppler
_annot_get_color()返回“一个新分配的PopplerColor,颜色值为
poppler
_annot或NULL。完成后必须
使用
g_free
()释放它”。
浏览 19
提问于2016-08-30
得票数 0
回答已采纳
1
回答
使用
Homebrew在MacOS上安装
Poppler
时遇到的
问题
、
、
通过搜索从PDF中
提取
注释
的方法,我找到了
使用
python和
poppler
的几个帖子。然而,尽管鼓励自制将是答案:我遇到了如下所述的类似
问题
: Traceback (most recent call last): File "pdf_annotations
浏览 1
提问于2018-10-04
得票数 1
4
回答
在Mac上安装
Poppler
for Python
、
、
我需要在Python中
提取
pdf
注释
。我所有的搜索都表明我需要
Poppler
来
做这件事,比如运行下一步,我尝试从下载并
使用
.Macports Error: Failed to install
po
浏览 10
提问于2015-08-24
得票数 11
1
回答
从PDF文件中突出显示的
注释
中
提取
文本
、
、
、
从昨天起,我就尝试
使用
python-
poppler
-qt4从一个pdf中的一些突出显示的
注释
中
提取
文本。根据,看起来我必须
使用
Page.text()方法获得文本,从高亮的
注释
中传递一个矩形参数,这是我
使用
Annotation.boundary()获得的。但我只收到空白短信。有人能帮我吗?我复制了下面的代码,并为我正在
使用
的PDF添加了一个链接。谢谢你的帮助!import popplerqt4import PyQt4 def
浏览 2
提问于2014-01-10
得票数 5
1
回答
从PDF中
提取
xdp或xfa
、
、
、
现在,我很难从PDF文件中以编程的方式
提取
数据,因为它已经被填充了。如果有库,c++、java、python或PHP是我的选择。
浏览 5
提问于2013-09-03
得票数 9
1
回答
将CodeBlocks链接到
Poppler
、
、
、
、
基本上,我希望编写一个程序,允许我从PDF文件中
提取
注释
。通过一些研究,我发现波普勒图书馆将允许我这样做。于是我下载了它,开始了在Windows上构建CodeBlocks (MinGW)的艰难过程。现在,我的
问题
是,我需要在我的main.cpp中写些什么,这样我才能
使用
Poppler
功能。然后我试着:但是,在我的代码中后来我被告知,"
poppler
“还没有被声明。\
poppler<
浏览 13
提问于2013-04-17
得票数 0
3
回答
如何从PDF文件中
提取
图像?
、
、
我需要从我的服务器上的PDF文件中
提取
所有的图像。我不想要PDF页面,只想在其原始大小和分辨率的图像。我如何
使用
Perl、PHP或任何其他基于UNIX的应用程序(我将
使用
PHP中的exec函数调用它们)
来
实现这一点?
浏览 1
提问于2009-01-10
得票数 21
回答已采纳
2
回答
如何在蔚蓝的网页应用程序中安装
poppler
?
、
、
、
、
我
使用
的是windows 11,我
使用
下面的命令在windows中安装
poppler
,这对我来说非常有用。conda install -c conda-forge
poppler
我知道这个错误,但我不知道如何在ubuntu18.04机器中解决它。在浏览了大量的堆栈溢出和askubuntu
问题
之后。
注释<
浏览 6
提问于2021-11-26
得票数 0
2
回答
获取CLI中PDF文件的“创建”时间戳
、
我知道我可以
使用
stat从文件系统获取访问/修改/更改信息,但是由于"Document“选项卡中的元数据被嵌入到文件本身中,我不知道如何通过CLI
提取
它。
浏览 0
提问于2012-03-12
得票数 4
回答已采纳
1
回答
将PDF打印到文件中(正如Evince所做的那样)
、
、
我需要一个PDF不可编辑和一个很好的方式
来
完成这是
使用
“打印到文件”的功能,在大多数PDF阅读器,以生成另一个PDF。我认为它们的工作方式是将PDF转换成图像,然后将这些图像嵌入到另一个PDF中。相比之下,在Evince中
使用
“打印到文件”功能可以生成一个与原始PDF几乎完全相同的PDF,而且速度也更快。我也尝试过pdftk,但是它产生了一个可编辑的PDF。注意:我的PDF也包含
注释
(或“邮票”),它们不一定是可编辑的(例如,
使用
Acrobat)。我上面概述的两个解决方案在这方面起了作用,而pdftk则生
浏览 0
提问于2021-08-12
得票数 0
3
回答
gtk+ clear GList
、
我需要删除gtk+应用程序中的所有内容并清除GList。我该怎么做呢?
浏览 6
提问于2010-07-25
得票数 0
3
回答
在Amazon实例(它有CentOS)上安装textract时出现
问题
。
因此,当我试图在Amazon实例中安装textract时,我面临着这个
问题
。我已经在网络上尝试了几乎所有可能的解决方案,似乎没有什么对我有用。有人能帮忙吗?
浏览 11
提问于2017-10-03
得票数 2
1
回答
布局解析器没有属性Detectron2LayoutModel。
我正在做一个项目,我需要用pdf格式从简历中
提取
信息,
问题
是当我
使用
pdfminer等库时,有时
提取
的文本不是很好的结果,因为它会从另一个文本框中得到与其他行重叠的行,这就是为什么我在
提取
文本之前首先考虑
使用
布局解析器
来
提取
基于文本框的文本pytesseract.pytesseract.tesseract_cmd ="C/Users/faty/Downloads/tesseract-ocr-w64-se
浏览 6
提问于2022-06-10
得票数 1
1
回答
Vader与多个PDF的情感
pdf_reader.getPage(i)pdf_file.close()我正试着用Vadersentiment
来
分析
浏览 3
提问于2018-11-22
得票数 0
1
回答
提取
PDF批注/
注释
、
、
我们有一个相当复杂的打印工作流程,其中的控制是
使用
Adobe Reader或Adobe Acrobat为生成的PDF文档的草稿版本添加
注释
和
注释
。作为工作流程的一部分,应解析导入的带有批注和
注释
的PDF文档,并将批注导入CMS系统(与PDF一起)。问:有没有什么可靠的工具(首选Python或Java)可以将这些数据以干净可靠的方式
提取
到PDF文件中?
浏览 4
提问于2012-12-07
得票数 2
回答已采纳
1
回答
调用单个第三方函数将导致regsvr32失败,即使作为管理员也是如此。
、
、
、
、
通常情况下,所有的东西都会被正确地建造和注册:前几天,我决定在我的项目中
使用
另一个库。它恰好是
poppler
库。我已经下载了Windows库的x64版本,。<
poppler
/cpp/
poppler
-document.h>然后,我将包含
poppler
文件的目录添加到.lib,并将如果我
注释
掉波普尔码的单
浏览 1
提问于2020-07-26
得票数 0
2
回答
安装用于PDF文本
提取
的弹出器
、
、
我试图跟随这个博客,尝试从发票pdf文件中
提取
文本。我的文本
提取
需要
提取
发票的特定字段。 我不确定如何
使用
这个.tar文件
来
解压包并在Python中
使用
它。任何建议,我如何在我的mac上安装它,然后在python中以编程方式
使用</e
浏览 24
提问于2020-04-24
得票数 2
1
回答
将批注从PDF导出并合并到另一PDF
、
、
、
我正在寻找一种方法
来
导出PDF的
注释
层,并将其合并回另一个PDF。我尝试过
使用
像
poppler
和PyPDF2这样的库,但到目前为止都没有效果。有没有我想要的开源库?
浏览 44
提问于2020-06-09
得票数 4
1
回答
内部和外部的C++字符串转换
、
、
我正在
使用
Poppler
从PDF中
提取
文本,并
使用
以下代码打印文本:for (std::vector<
poppler
::text_box>::iterator it = currpg.begin(); it !我想"/“可能导致了一个
问题
,但也有日
浏览 2
提问于2021-03-31
得票数 0
回答已采纳
3
回答
在Python中阅读PDF包?
、
、
我想阅读每封电子邮件的文本,并
提取
附件。但是,我找不到关于如何在python中阅读pdf包的信息。我尝试过
使用
库PDFMiner和textract,但输出结果只是这样:“为了获得最佳体验,请在Acrobat X或Adobe Reader X或更高版本中打开此PDF包。
浏览 0
提问于2017-01-12
得票数 0
点击加载更多
相关
资讯
怎么把pdf文档保存成图片格式
不再为处理PDF烦恼,python处理操作PDF全攻略
手把手教你如何用 Python从PDF 文件中导出数据
手把手教你如何用Python从PDF文件中导出数据
AAAI 2017 牛津大学:网络事件提取中结构和文本特征的联合学习
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券