腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
可
文本
搜索
的
PDF
中
搜索
regex
模式
并
返回
位置
坐标
、
、
、
我已经安装了几个模块,但找不到一个适合我
的
需求。也许你可以带我去找对
的
地方。 我想在已经可以
文本
搜索
的
PDF
中
搜索
某个
模式
(A-Z0-90-9),它应该会
返回
所有
位置
(X1,Y1,X2,Y2)。
浏览 3
提问于2020-05-15
得票数 2
回答已采纳
3
回答
如何使用任何Java库使现有的
PDF
文本
可
搜索
?用OCR
、
、
如何使用任何java库生成
可
搜索
的
文本
?开源或付费。 如何使用PDFBox将OCR应用于
pdf
?如何使
pdf
文本
可编程
搜索
使用pdfbox,我
搜索
了很多。没有找到任何解决办法。有人能粘贴OCR PDFBox
的
代码吗?
浏览 8
提问于2014-04-04
得票数 0
回答已采纳
2
回答
在
大型
文本
上使用
RegEx
的
最佳方法
、
、
我有一个
文本
列,其中包含
PDF
,word,excel等纯
文本
。使用SQL
搜索
短语非常有用。当
文本
是大
的
,,27 MB, CPU跳转到接近100%,
并
缓慢地完成这项工作。
regex
模
浏览 6
提问于2012-10-17
得票数 1
1
回答
如何使用特定
模式
(语法)来pdfgrep?
、
我试图使用pdfgrep
搜索
每个特定
模式
的
出现(必须以E或S开头),然后后面跟着5位数字(仅),然后执行一个命令(可能是mv命令)。到目前为止,我有以下命令: pdfgrep -e '[E-S]\d{5,}但为了我
的
生命,我无法
在
PDF
中找到任何东西。
搜索
特定
的
术语(pdfgrep " term“filename.
pdf
)确实会
返回
该术语,因此我知道pdfgrep能够找到它。我猜我
的</e
浏览 0
提问于2021-02-03
得票数 1
1
回答
使用Google Vision API扫描
的
OCR地图
、
、
、
、
我
的
最终目标是从一系列
的
乡村地图中读取土地所有者
的
名字,
并
记录其
位置
。有关输入
的
示例,请参见。现在,我
的
想法是使用Google vision API提取
文本
,然后将
文本
链接回地图上
的
原始网格
坐标
。我使用标准
的
python代码从中提取此
文本
。这给我留下了两个问题: 1)我知道API只输出JSON文件。这个JSON是否记录了提取
的
文本</em
浏览 2
提问于2020-04-02
得票数 0
1
回答
使用tesseract 2.04和Java获取
文本
位置
、
、
、
、
我正在使用Tesseract 2.04
在
一些图像
中
执行OCR,现在我必须获得
文本
的
精确
位置
。但是这个版本不会
返回
这个信息。 我需要这个来生成一个
可
搜索
的
pdf
文件。我已经学习了如何在
pdf
的
底层
中
盖章
文本
,但我需要
位置
来盖章这个
文本
。我
的
第一个想法是
在
pdf
浏览 17
提问于2011-12-06
得票数 3
回答已采纳
2
回答
如何使用PHP读取和
搜索
pdf
文件
中
的
特定单词?这在PHP
中
是可能
的
吗?
、
、
请检查网址:有人能帮我解决这个问题吗?
浏览 3
提问于2010-08-20
得票数 0
1
回答
如何使用python
在
扫描
的
PDF
中
添加隐藏
的
文本
层?
、
我从扫描
的
PDF
和
文本
的
位置
得到了
文本
。] 现在,我想使用python将这个
文本
添加到同一个
PDF
中
的
给定
坐标
中
,
在
隐藏
的
<em
浏览 2
提问于2022-01-04
得票数 1
1
回答
确定
PDF
文件
中
是否有
可
搜索
的
PHP
文本
、
、
我们
在
服务器上有数百个
PDF
文件。其中有些包含
可
搜索
的
文本
,而另一些则没有。 我被要求找出哪些是
可
搜索
的
,哪些是不可
搜索
的
。有没有人知道如何阅读一堆
PDF
文档,
并
确定该
pdf
文档是否包含
可
搜索
/可选
的
文本
,还是只包含需要为OCRd
的
不可选/
浏览 5
提问于2013-05-15
得票数 3
回答已采纳
1
回答
Azure search将文档添加到索引方法
、
在
核心层,我们有
可
搜索
的
PDF
文档,我们希望将它们
的
文本
添加到索引
中
,以便所有这些文档都是
可
搜索
的
。最初
的
想法是通过add document rest api将该文档提交到索引。当时
的
想法是,这将是将该文档
的
文本
放入索引
的
最简单、最快捷
的
方法。我们还考虑使用索引器,
在
blob
浏览 14
提问于2020-01-10
得票数 0
2
回答
如何在Grails
中
实现空间(地理
位置
)
搜索
?
、
、
、
我需要在数据库
中
存储某些
位置
的
纬度和经度,然后根据用户的当前
位置
,我需要
返回
位于该
位置
特定半径范围内
的
项。因此,我们基本上有以下要求: 在给定
的
用户当前
坐标
半径内进行全文
搜索
的</
浏览 5
提问于2010-07-13
得票数 7
2
回答
GCP OCR服务-将扫描
的
PDF
或图像转换为
可
搜索
的
PDF
、
是否可以使用Google平台
的
OCR将扫描
的
PDF
转换为新
的
可
搜索
PDF
文件?
浏览 2
提问于2018-01-24
得票数 0
1
回答
如何在python中使用
可
搜索
的
文本
向
PDF
添加URL?
、
我有几个
PDF
文件扫描旧
的
书籍与
可
搜索
的
文本
。我想添加链接到
文本
匹配
的
模式
。以下是合乎逻辑
的
步骤: 1-查找
模式
;2-获取
文本
的
位置
;3-
在
该
位置
添加到
文本
的
链接。例如,每当我发现一个数字超过4位数时,我就向网站添加一个链接(
文本
周围
的
方格
浏览 0
提问于2019-08-01
得票数 0
回答已采纳
1
回答
是否可以从
可
搜索
的
PDF
访问
文本
覆盖?
、
我知道
PDF
和
文本
可
搜索
的
PDF
是有区别的。
文本
可
搜索
PDF
具有用于
搜索
的
文本
覆盖。是否可以将此
文本
覆盖提取到txt文件
中
?也许可以使用Adobe API?
浏览 4
提问于2012-10-05
得票数 8
回答已采纳
1
回答
解析python
中
的
PDF
形状数据
、
、
、
当使用此驱动程序时,所有SHX字体都被呈现为形状数据,而不是
文本
数据,但是,它们确实有一个注释插入到
PDF
中
,
在
预期
的
位置
使用预期
的
文本
。到目前为止,
在
我
的
脚本
中
,我已经让它在
PDF
中
运行,并在每个部分
的
顶部插入隐藏
的
文本
,
文本
压缩到评论
的
大小,这给了我90%
的</e
浏览 4
提问于2022-02-02
得票数 2
回答已采纳
1
回答
Python:
在
PDF
中
搜索
文本
、
我想写一个这样
的
函数: 输入:
PDF
文件,字符串(
PDF
是
可
搜索
的
-例如,它是由MS创建
的
)输出:
PDF
文件
中
字符串
的
页面和
位置
(
坐标
:X和y)。
浏览 3
提问于2014-06-25
得票数 0
2
回答
如何编辑
可
搜索
PDF
的
搜索
文本
?
、
我可以访问我
的
图书馆
的
扫描仪,它可以创建“
可
搜索
的
PDF
”。这些
PDF
显示扫描文档的确切图像,但是当您尝试选择包含
文本
的
图像
的
一部分时,
PDF
中有一种隐藏
的
文本
可以被选择。通过这种方式,您可以
在
扫描文档
中
复制和粘贴
文本
或
搜索
文本
。这很有用。这是一个可怕
的
改进
浏览 6
提问于2015-10-02
得票数 1
2
回答
如何在MySQL查询中正则化
、
、
、
我有一个简单
的
任务,在那里,我需要
搜索
一个记录,以字符串字符开始,然后再
搜索
一个数字。我想要
的
是和但是这两个查询都总是
返回
一个null记录。trecord FROM `tbl` WHERE (trecord LIKE 'ALA
浏览 6
提问于2013-09-13
得票数 64
回答已采纳
2
回答
在
OCRed
PDF
中
创建“
文本
”
、
、
我想以编程方式创建我已OCR‘
的
图像
的
PDF
。我可以让它成为可选择/
可
搜索
的
。 我知道每个字母
的
内容和
位置
。我
的
想法是
在
每个
位置
创建一个看不见
的
文字字母。我想试着猜测字母
的
水平大小,然后写整行,但字体
的
宽度变化很大(例如,等宽字体或非等宽字体),所以它可能不匹配。我以前见过可选择/
可
搜索
<e
浏览 0
提问于2014-12-18
得票数 1
1
回答
提取
pdf
文件中指定字符串
的
位置
。
、
我不熟悉
pdf
渲染系统或postscript,我想知道原则上是否可以提取
pdf
中
字符串
的
位置
。即: 给出了一个包含常规
文本
段落(不是表单文件\
文本
框或其他对象,简单
文本
)
的
pdf
格式,
搜索
文件
中
的
特定字符串,得到第一个字母
的
x,y
坐标
。。我用多种语言
搜索
了
pdf
-lib,但它们似乎不允许这样<
浏览 5
提问于2022-10-18
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
搞定Linux Shell文本处理工具,看完这篇集锦就够了
学R学初阶_01_R中的正则表达式
用公式提取Excel单元格中的汉字
给JAVA程序员的正则表达式入门课
Python 高级编程之正则表达式(八)
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券