腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
从
文件
中
的
某些
位置
提取
文本
?
、
以下是我
的
数据:
文本
<- **9 Mr.ABCD. Content1。DEFG.Content2夫人。**8 Mr.DBC其他东西。Content3。
如何
获取如下数据帧: 9 ABCD先生。Content3 3行,4个变量(数字,先生/夫人,姓名,内容) 我
的
数据
中
的
姓名总是在先生或夫人之后,而且总是大写。在我想要
的
内容之前总是有一个句号。
浏览 12
提问于2021-09-18
得票数 0
2
回答
提取
LTFigure对象后面的
文本
、
、
我正在使用python pdfminer库(参见docs)
从
pdf
文件
中
提取
文本
。 然而,pdfminer似乎无法
提取
某些
文件
中
的
所有
文本
,而是
提取
LTFigure对象。假设从这个对象
的
位置
,它“覆盖”了一些
文本
,因此这个
文本
没有被
提取
出来。pdf
文件
和包含
从
pdf
提
浏览 149
提问于2021-01-28
得票数 0
回答已采纳
1
回答
如何
使用pdfbox获得pdf
的
最大fontsize
、
、
、
我使用pdfbox
从
pdf中
提取
一些信息,但是
如何
提取
每个对象
的
信息?如果其中一个包含流,我
如何
解码该流以显示? 我能从一个pdf框
中
得到最大字体大小
的
吗?我想如果我能得到每个对象
的
字体大小并对它们进行排序,那么我就得到了具有最大字体大小
的
对象?
浏览 8
提问于2015-03-23
得票数 1
1
回答
PDFBox :在
提取
文本
时维护PDF结构
、
我正在尝试
从
PDF中
提取
文本
,PDF
中
充满了表格。在
某些
情况下,列是空
的
。当我
从
PDF中
提取
文本
时,emptys列会被跳过并替换为空格,因此,我
的
正则表达式无法确定在这个
位置
有一个没有信息
的
列。更好地理解图像:我们可以看到,在
提取
的
文本
中
,列并不受尊重。
从
PDF中
提取</e
浏览 2
提问于2017-08-23
得票数 3
回答已采纳
2
回答
缺少.msi
文件
会导致修复Server 2008R2时出现错误
、
我安装了一个SQLServer2008R2 SP1数据库,并试图使用一个2008R2安装二进制
文件
对其进行修复。📷
浏览 0
提问于2016-06-23
得票数 5
回答已采纳
1
回答
基于用户触摸
位置
从
PDF中
提取
文本
、
、
、
、
如何
使用Objective C
从
PDF
文件
中
提取
文本
?请帮帮我。 提前谢谢。
浏览 1
提问于2011-07-07
得票数 3
1
回答
在Python
中
根据索引表减去
文本
文件
中
的
字符串
、
、
我有一个.txt
文件
,我想
提取
Python
中
某些
位置
之间
的
文本
。为了做到这一点,我做了一个
位置
的
索引列表,所以我可以减去这些
位置
,以便获得
文本
。并将其附加到不同
的
.txt
文件
中
。
浏览 15
提问于2019-12-09
得票数 1
回答已采纳
1
回答
将pdf
文件
转换为新目录
中
的
原始
文本
、
、
、
、
,这是我正在尝试
的
:from PyPDF2 import PdfFileWriter, PdfFileReader import config print page.extractText() # failing here 整个程序是解密一个大
的
pdf
文件
从一个
位置
,并分裂成一个单独
的
pdf
文件
每页在新
的</em
浏览 1
提问于2019-07-23
得票数 0
1
回答
Ghostscript没有
从
PDF
文件
中
提取
所有
文本
、
我使用鬼怪脚本8.71
从
PDF页面中
提取
文本
。我使用
的
命令是: -dWRITESYSTEMDICT-dSIMPLE -fps2ascii.ps -dFirstPage=1 \我正在使用<stdout>将
文本
定向到另一个
文件
但问题是Ghostsc
浏览 3
提问于2010-09-01
得票数 1
2
回答
如何
使用PHP读取和搜索pdf
文件
中
的
特定单词?这在PHP
中
是可能
的
吗?
、
、
请检查网址:有人能帮我解决这个问题吗?
浏览 3
提问于2010-08-20
得票数 0
1
回答
如何
从
文本
文件
中
读取DNA序列并将其存储在C
中
的
数组
中
?
、
如何
用C语言
从
文本
文件
中
读取DNA序列,并将其存储在数组
中
,并从每个核苷酸
位置
提取
给定长度
的
所有子字符串?例如,
文本
文件
中
的
序列如下所示 如果子字符串
的
长度=3 cct,ctg,tga,gat,.,cat
浏览 3
提问于2012-03-06
得票数 0
1
回答
使用xpath或regexp设置import.io crawler
、
、
、
我目前正在尝试设置一个网络爬虫来
从
房地产网站
提取
数据。这是这些网站
的
一种趋势,
某些
信息不在每个页面的相同
位置
,所以我必须弄清楚
如何
让它
提取
包含
某些
短语
的
文本
元素,而不是基于它们所在
的
位置
。以下是此类页面的一些示例: 注意
某些
信息是
如何
在不同
的
位置
显示
的
,比如MLS #。当我从这些条目中<e
浏览 2
提问于2015-06-23
得票数 5
1
回答
如何
像Chrome浏览器那样使用Python
从
PDF中
提取
文本
?
、
、
我正在尝试
从
pdf
文件
中
提取
文本
(类似于表单)。目前,我在Chrome上打开
文件
,选择/复制所有
文本
,将其粘贴到txt
文件
中
,然后使用Python将其处理为CSV。Chrome让我
的
数据非常结构化和统一,这样pdf
的
每一页都会产生类似的
文本
块,让我可以轻松地处理它。我试图直接
从
pdf中
提取
文本
,以将其处理为CSV格式,但由于原始pdf<
浏览 35
提问于2021-06-16
得票数 0
1
回答
Java -
从
文件
中
的
特定索引中
提取
相关
的
字符串/字符
、
、
、
我希望
从
txt
文件
中
的
特定索引中
提取
相关
的
字符串/字符。我知道
如何
逐行读取
文本
文件
,但我需要帮助
从
行
的
固定
位置
提取
相关字符串。假设我有一个包含以下内容
的
txt
文件
:“12345671234567892Hello testingblabla”
位置<
浏览 2
提问于2018-02-19
得票数 0
回答已采纳
1
回答
从
通用视频编码中
提取
运动矢量
、
、
、
、
如何
从
VVC VTM参考软件将运动矢量
提取
到.txt或.xml
文件
中
。我设法将运动矢量
提取
到一个
文本
文件
中
,但我没有正确
的
索引来指示哪个运动矢量属于哪个
位置
。如果有人能指导我
如何
获得正确
的
索引和运动矢量,那将是非常有帮助
的
。
浏览 16
提问于2021-09-04
得票数 0
1
回答
如何
筛选屏幕上可见
的
HTML节点
、
、
、
我目前正在做一个铬
的
扩展,它将允许我
从
网页上
的
字体中
提取
字体
文件
。因为这是标题标签,所以页面上没有实际显示该字体
的
元素。是否可能只对网页上可见
文本
浏览 3
提问于2022-06-02
得票数 0
3
回答
如何
使用任何Java库使现有的PDF
文本
可搜索?用OCR
、
、
如何
使用任何java库生成可搜索
的
文本
?开源或付费。
如何
使用PDFBox将OCR应用于pdf?
如何
使pdf
文本
可编程搜索使用pdfbox,我搜索了很多。没有找到任何解决办法。有人能粘贴OCR PDFBox
的
代码吗?
浏览 8
提问于2014-04-04
得票数 0
回答已采纳
2
回答
如何
使用unix
从
文件
中
提取
特定字节
、
、
如何
从
二进制
文件
的
某些
位置
提取
12字节块。如果我想
提取
前12个字节,我可以这样做如果我想从byte61
中
提取
12个字节,我可以这样做如果我有20个12字节
的
区块需要
提取
,有没有更简单
的
方法 谢谢
浏览 2
提问于2010-01-07
得票数 8
回答已采纳
1
回答
NiFi :使用csv
文件
中
的
字段值创建
文件
名
我有一个带有单一记录
的
csv流
文件
。我需要根据csv
文件
中
的
两个列值来创建它
的
文件
名。请让我知道
如何
使用列名,而不是列
的
位置
,因为列
的
位置
可能会改变。实例姓名、城市、州、国家、性别
文件
名应该是John_USA.csv 我正在尝试
提取
文本
处理器,并使用- row
浏览 2
提问于2020-05-29
得票数 0
回答已采纳
1
回答
Python
文本
提取
不适用于
某些
pdfs。
、
、
、
、
我遵循了许多堆栈溢出建议,并使用PyPdf2 FileReader
从
pdf中
提取
文本
。我
的
代码如下所示:#url = "http://kat.kar.nic.inprint pdf.getNumPages()print pdf.getP
浏览 0
提问于2015-05-16
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用Python从PDF文件中提取文本词汇
如何优雅的提取ass字幕文件里的文本?
ISO文件怎么打开?如何提取ISO中的文件?
如何提取PDF文件中的图片内容?
文字识别:如何快速精准的从图片中提取文本!
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券