腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何使用doc取器在
PDF
文件
中搜索文本?
、
、
我试图在
PDF
文件
中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件
,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件
和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件
?
PDF
文件
之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
在PHP中标识
PDF
/A
文件
、
、
我正在尝试
识别
PDF
文件
是否为
PDF
/A
文件
。使用poppler-php,我能够读取元数据,但没有迹象表明它是
PDF
/A
文件
。 我的目标是通过添加数据来编辑
PDF
。
PDF
/A似乎是只读的(因为它们是为存档而设计的,这并不奇怪)。我想要
识别
他们,以便提前拒绝他们。 致以敬意,
浏览 9
提问于2020-09-07
得票数 1
回答已采纳
3
回答
从二进制数据
识别
不带扩展名的
文件
类型
、
、
、
我有一些没有扩展名的
文件
。我希望将扩展关联到它们。为此,我编写了一个python程序来读取
文件
中的数据。我的疑问是,我如何才能在没有扩展的情况下
识别
其类型,而不使用第三方工具。我只能
识别
pdf
,doc和文本
文件
。其他类型的
文件
是不可能的。 我的服务器是cent。
浏览 0
提问于2012-08-30
得票数 3
回答已采纳
1
回答
我需要关于在网络上显示(和/或转换)
pdf
文件
的建议
、
、
、
我们也想接受
PDF
,但我不确定显示
PDF
或将其转换为html的最佳方式是什么。或者,我们可以忘记直接显示
PDF
文件
,而是像处理Word文档那样将它们转换为html,但我还没有遇到一个好看的库来实现这一点。最后一件事,我们计划为付费客户提供下载原始
PDF
文件
的选项。这可能会很复杂吗?在构建流程的其余部分时,有什么是我应该牢记的吗?
浏览 2
提问于2012-03-24
得票数 3
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换为可搜索的
PDF
?
、
、
、
我想使用Google 将不可搜索的
PDF
转换成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传
文件
到另一个网站或下载的
文件
,以进行转换。我只看到人们转换成文本或文档
文件
。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
1
回答
如何使用python
识别
pdf
中的图形?
、
、
、
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
Acrobat OCR
识别
的访问文本
、
、
我有
PDF
文件
已经被“
识别
”使用OCR文本
识别
->
识别
文本使用功能在Acrobat。有什么想法吗?
浏览 0
提问于2010-06-25
得票数 0
回答已采纳
1
回答
幽灵脚本将我的
pdf
转换成cmyk,但不是真的
、
、
、
-o converted-to-cmky.
pdf
/original-srgb.
pdf
identify -verbose ./converted-to-cmky.
pdf
它还报道了“彩色空间:sRGB”。
浏览 3
提问于2022-02-24
得票数 0
1
回答
巨蟒中的Camelot不像预期的那样运行。
我有两个
pdf
文件
,都在同一个布局与不同的信息。问题是:我可以很好地阅读其中一个,但另一个是无法
识别
的数据。这是一个我可以很好地阅读的例子,下载 from_
pdf
= camelot.read_
pdf
('2019_05_2.
pdf
', flavor='stream', strict=False) camelot.plot(from_
pdf
浏览 4
提问于2021-09-09
得票数 0
回答已采纳
1
回答
PDF
生成器标识
、
、
识别
自动生成的
PDF
的生成器/检测模式的最佳方法是什么?我一直在使用Tabula和文本分析来提取
文件
识别
后的数据,但我很难将
文件
分派到正确的解析器。显然,
PDF
没有关于作者的元数据,并且
文件
名可以更改,因此不是一个准确的身份
识别
来源。 谢谢,亚瑟
浏览 12
提问于2020-10-01
得票数 0
1
回答
GUI程序调整
pdf
文档的大小并更改它们的DPI
、
、
我看到,LibreOffice绘图应该能够打开一个
pdf
和导出它的选项,以改变质量和新闻部的决议。
浏览 0
提问于2013-04-11
得票数 12
回答已采纳
1
回答
从SharePoint查询web服务返回的
PDF
URL不一致
、
、
当web服务返回Word/Excel/PowerPoint文档时,它们包含指向实际
文件
的链接,例如。当web服务返回
PDF
文档时,它们包含指向链接到
PDF
文档的页面的链接,例如包含指向的链接的。
浏览 0
提问于2010-09-18
得票数 0
4
回答
哪些工具可以在Mac上将扫描过的纸张
文件
转换成可搜索的文本
pdf
?
、
、
、
、
我需要将扫描文档转换为mac上可搜索的文本
PDF
。 Acrobat可以通过其文本
识别
功能完美地完成这一任务,但考虑到我只需要这一个功能,Acrobat是相当昂贵的。有没有其他OCR工具可以做到这一点?
浏览 0
提问于2015-03-02
得票数 2
回答已采纳
1
回答
如何使用Firebase ML工具包
识别
PDF
文件
中的文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件
中的文本。 看起来Firebase ML工具包不支持
PDF
文件
,对吗?使用Firebase ML工具包是否不可能
识别
PDF
文件
中的文本?
浏览 1
提问于2019-03-07
得票数 0
1
回答
OCR表格
识别
V2是否支持
PDF
多页
识别
?
浏览 144
提问于2022-06-15
2
回答
使用Google Cloud Vision的OCR
PDF
文件
?
、
、
、
目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的
PDF
文件
的后端?如果没有,如何使用Google Cloud Vision将
PDF
转换为OCRed
PDF
?据我所知,Cloud Vision目前支持
PDF
文件
,但它只能将
识别
的文本输出为JSON
文件
。因此,似乎需要在Google Cloud Vision之外的另一个步骤中,将这个转换后的文本放在
PDF
中的图像顶部。我经常需要将扫描的
浏览 0
提问于2018-09-15
得票数 4
1
回答
雷鸟将一些
pdf
文件
识别
为视频
、
、
、
我使用的Ubuntu14.04,最近有一个问题,雷鸟:一些
pdf
文件
附加到电子邮件不应视为
pdf
文件
。
pdf
的附件设置选项被设置为使用文档查看器自动打开
pdf
文件
。这适用于附件中的一些(大多数)
pdf
文件
。但是,对于某些
文件
,会打开一个对话框,询问附件应该做什么,并建议使用视频播放器打开它。如果我将附件保存到某个
文件
夹,它将被正确地
识别
为
pdf
,并与正确的自动程
浏览 0
提问于2016-05-04
得票数 1
回答已采纳
1
回答
在我的网页上使用
PDF
文件
的内容有什么问题吗?
、
当我搜索一个项目时,谷歌会推荐
PDF
格式的结果。谷歌如何
识别
PDF
内容?在我的网站上使用
PDF
文件
的内容有什么问题吗?该网站的内容是否会被谷歌
识别
为重复内容?会不会对网站的搜索引擎优化产生负面影响?
浏览 0
提问于2018-10-19
得票数 3
回答已采纳
2
回答
如何
识别
pdf
文件
中的表格
、
、
我想要
识别
一个
pdf
文件
中的表格。在C#中使用了什么SDK来
识别
pdf
中的表,以及一些逐个单元格读取的机制,有人能推荐一下吗?
浏览 1
提问于2011-08-06
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PDF文件识别软件有哪些?分享三个PDF识别文字软件
PDF文件如何识别?这些方法你该知道!
下面告诉你pdf文件识别软件哪个好
pdf文件压缩,怎样压缩pdf文件?
pdf文件太大怎么变小?压缩PDF文件指南
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券