腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
javascript
从
PDF
中
选择
和
提取
特定
文本
?
我正在开发一个
从
PDF
中
提取
高亮
文本
的chrome扩展。 我有没有办法用
javascript
来完成这个任务?我可以
从
HTML页面中
选择
文本
,但是,我无法
从
浏览器
中
打开的
PDF
文件中
选择
文本
。
浏览 28
提问于2020-05-14
得票数 0
3
回答
如何
在
pdf
.js
中
从
用户
选择
中
检索
文本
?
、
、
这个问题是
特定
于
pdf
.js,一个基于
javascript
的
pdf
渲染器。我正在构建一个自定义版本,在这里我需要
提取
我在
pdf
中
选择
的
文本
。在其他文章
中
,您可以从一个页面或整个
pdf
文档(如one )
中
获取
文本
,但我希望获取用户
选择
的
特定
文本
,并警告它或在控制台中打印它。
浏览 11
提问于2018-02-23
得票数 8
回答已采纳
1
回答
从
PDF
格式的嵌套表中
提取
数据
、
、
、
我有几个
pdf
文件是
从
word或excel文件
中
创建的。我需要获取表
中
的信息。文档
中
的
文本
不是图像,所以我能够
使用
pdfbox之类的工具
提取
文本
。当我有
文本
时,我无法知道它属于哪些单元格,因为我不知道表的边框在哪里。Iv‘e尝试了一些桌面工具,比如abby或solid
pdf
转换器,它们能够实现。要将这些文件转换成漂亮的word文档,但这不符合我的需要,因为我希望能够在C#
中
逐步完
浏览 3
提问于2010-08-20
得票数 3
1
回答
通过html编辑
pdf
、
、
、
、
我不确定这里是否适合这个问题,但我找不到任何其他的建议媒介。
浏览 3
提问于2013-06-02
得票数 0
回答已采纳
4
回答
如何
从
pdf
文档中
提取
特定
矩形区域内的
文本
?
、
我必须从一个
特定
的矩形区域内的
pdf
文件中
提取
文本
。工作流程如下。首先,将
pdf
转换为jpg图像。然后,用户在图片顶部绘制
选择
矩形。然后我需要从
pdf
文档中
提取
该
选择
区域内的所有
文本
。有什么建议可以
从
C#下载免费的
pdf
库来
使用
吗?
浏览 6
提问于2010-11-29
得票数 6
回答已采纳
2
回答
iText在安卓系统上的
文本
提取
/阅读
、
、
我
和
iText有点问题。其他人说iText只用于创建
PDF
?而且它不能从
PDF
中
读取或
提取
文本
。这是真的吗?如果这是真的,那么我还可以
选择
哪些其他选项来
从
PDF
文件中
提取
文本
并将其保存在变量
中
或显示在Android设备
中
? 如果iText能够
从
PDF
中
提取
文本
,那么
如何
<em
浏览 0
提问于2012-10-22
得票数 2
回答已采纳
8
回答
PDF
中
的Copy+pasting
文本
导致垃圾
、
它从
PDF
文件中
提取
纯
文本
。有几个
PDF
文件无法正确
提取
。
提取
器(PDFBox库)返回如下字符串: 我是检查每个文件,使这个
提取
的问题,所有这些文件的
文本
也不能复制粘贴
从
PDF
(Adob
浏览 5
提问于2010-05-28
得票数 15
1
回答
试图了解当GlyphMapping表为Type0 MSGothic
Pdf
字体为空时
如何
正确地呈现文档
、
、
我正在处理一个
pdf
文档,该文档
中
似乎没有任何信息,但是Adobe应用程序正确地呈现了文档。我
使用
Pdf
调试器查看文档属性。希望有人能帮助我理解应用程序是
如何
呈现文档的。我的理解是,对于Type 0字体,映射数据必须存在于
pdf
中
,并且要显示的字符串被解释为代表CID的字节对。 (\201@\201\203\222\312\2
浏览 3
提问于2022-07-29
得票数 0
1
回答
如何
使用
pdfbox获得
pdf
的最大fontsize
、
、
、
我
使用
pdfbox
从
pdf
中
提取
一些信息,但是
如何
提取
每个对象的信息?如果其中一个包含流,我
如何
解码该流以显示? 我能从一个
pdf
框
中
得到最大字体大小的吗?
浏览 8
提问于2015-03-23
得票数 1
1
回答
获取
JavaScript
文件
中
特定
字符串的坐标
、
、
有没有
JavaScript
解决方案可以让我获得文件
中
特定
字符串的x
和
y坐标以及宽度
和
高度?
PDF
.JS可以
从
PDF
文件中
提取
文本
块,并给出x
和
y坐标以及这些块的宽度
和
高度。但我对这些
文本
块
如何
组合在一起没有任何影响(
从
单个字符到更大的几个单词),我也不知道
如何
处理这样的块的各个部分的坐标。 这意味着如果
浏览 109
提问于2021-06-28
得票数 0
1
回答
Python读取
pdf
文件
、
如何
使用
jupyter实验室
从
pdf
文件
中
读取
和
提取
表格? 一个典型的
pdf
文件与
文本
之间的文字字幕
和
表格。我需要编码来
提取
特定
标题下的表格,并清理一些不需要的
文本
,比如页码。
浏览 3
提问于2022-09-19
得票数 -1
6
回答
如何
从
PDF
中
提取
格式化
文本
内容
、
、
、
、
如何
从
PDF
中
提取
文本
内容(而不是图像),同时(粗略地)像Google Docs那样保持样式
和
布局?
浏览 2
提问于2010-02-04
得票数 16
回答已采纳
2
回答
使用
javascript
读取
PDF
文件
、
、
我目前正在开发一个可以
使用
Copy/Transfer a sentence/paragraph from a
PDF
file to my program的应用程序。我正在
使用
Javascript
开发我的程序,但我还没有找到任何想法
如何
读取
PDF
文件。谢谢。
浏览 3
提问于2012-08-22
得票数 16
1
回答
使用
python
从
PDF
文件中
提取
相关
文本
、
、
、
使用
python只
从
整个
PDF
文件中
提取
相关
文本
,并将输出数据存储到Excel的
特定
列
中
。我试图解决它,但不能
提取
特定
的
文本
值。下面是需要
提取
的示例输出的屏幕截图:我想
提取
excel.不同列
中
的发票号、订单号
和
总价值。到目前为止,我已经尝试过:
pdf
= pdfplumber.o
浏览 8
提问于2020-09-30
得票数 0
1
回答
波斯文件的PDFBOX
、
、
、
、
我想
使用
pdfBox
从
波斯语
pdf
文件中
提取
测试,但是它返回所有波斯字符的"?" (它正确地返回同一文档
中
的拉丁单词)。 我怎么才能修好它?有什么建议吗?
浏览 3
提问于2018-08-29
得票数 3
2
回答
仅
使用
javascript
从
pdf
文件中
提取
文本
、
、
如何
在客户端
和
任何浏览器中
使用
javascript
从
pdf
文件中
提取
数据?
浏览 2
提问于2012-12-13
得票数 3
3
回答
如何
使用
任何Java库使现有的
PDF
文本
可搜索?用OCR
、
、
如何
使用
任何java库生成可搜索的
文本
?开源或付费。
如何
使用
PDFBox将OCR应用于
pdf
?
如何
使
pdf
文本
可编程搜索
使用
pdfbox,我搜索了很多。没有找到任何解决办法。
浏览 8
提问于2014-04-04
得票数 0
回答已采纳
3
回答
从
PDF
中
提取
表格
、
、
我正在尝试
从
pdf
文件中
提取
表格。请帮帮我 提前谢谢。
浏览 4
提问于2013-07-11
得票数 3
1
回答
用python
从
pdf
中
提取
特定
文本
是否可以
使用
python
从
pdf
中
提取
特定
的
文本
。 测试用例:我有一个超过10页的
PDF
文件,我需要
提取
特定
的
文本
和
与它们相关联的值。示例:用户:value用户id:value。需要
提取
这些值。我能够阅读所有的页面,我现在想要具体的
文本
。
浏览 3
提问于2020-05-10
得票数 0
1
回答
PDFBox :
从
表中
提取
数据
、
、
如何
使用
pdfbox
从
pdf
格式的表格中
提取
数据?在这个过程
中
,
使用
PDContentStream
和
PageStripper classes.Index可以找到
文本
和
内容的索引,必须找到表
中
的行,有人可以帮助扩展哪个类
和
实现哪个方法吗?我尝试了以下方法来
提取
文本
的起始索引: public sta
浏览 0
提问于2016-06-30
得票数 3
点击加载更多
相关
资讯
如何用Python从PDF文件中提取文本词汇
如何使用DNS和SQLi从数据库中获取数据样本
手提袋和手挽袋在服装店中的使用,如何选择
科技行业中如何使用错别字识别工具提高文本处理效率和质量?
路由器和交换机有什么不同?在实际使用中如何选择
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券