腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何修复在Apache Tika for Python中解析的
中文
PDF
以正确读取字符?
、
、
、
我有一个下载的
PDF
在中国,我想提取文本从使用提卡+ Python (原始链接到完整的
PDF
可以找到,或提取的样本页面可以找到)。当我运行以下代码时file_data = parser.from_fileÆ Éª £¬ £Ì £® £È £® 我创建
浏览 1
提问于2020-09-07
得票数 0
1
回答
快速检查
PDF
文件上的
OCR
文本层
、
有没有什么程序可以让我在
PDF
渲染的基础上叠加
PDF
的文本(
OCR
)层?如果这可以用程序来完成,那会更方便,如果不能,一些cli命令或脚本也可以工作。
浏览 2
提问于2017-11-18
得票数 1
2
回答
开放源码
中文
OCR
、
、
、
我到处寻找开放源码的
OCR
,寻找
中文
。但如果没有任何运气,似乎很少有一些开放源码的
OCR
(为
中文
)是可用的。environment?What's是否有用于制作的开放源码?对于拉丁文和
中文
实现
OCR
的主要区别是?我知道一些好的
OCR
,如Tesseract或Ocropus,如果我想让它支持
中文
,我该怎么办? 如有任何帮助,请提前表示感谢。
浏览 3
提问于2009-12-15
得票数 9
回答已采纳
2
回答
哪种软件可用于
PDF
扫描,可以提取信息并发送到发票程序?
、
、
、
、
我在一家公司当实习生,他们需要精确扫描
PDF
格式的发票。该程序,即java库,需要能够提取发票的某些部分,这样用户就不必手动重新键入信息。
浏览 0
提问于2019-09-12
得票数 0
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
1
回答
带有文件插入的汉字
OCR
我试图
OCR
一个文件插入到谷歌驱动器。正在插入的图像包含汉字。当OCRing时,图像会像往常一样转换为Google,但是没有一个文本被提取出来。这不会返回错误,但不会发生
OCR
。根据docs,这个参数只是一个提示,如果
OCR
引擎能够计算出语言,它就会被覆盖。所以我的问题是: 注:在浏览器中上传图像时,
OCR
语言下拉式包含
中文
(简体和繁体)
浏览 3
提问于2014-07-25
得票数 1
1
回答
基于Tesseract
OCR
的汉字识别
、
、
、
我一直在使用Tesseract 3.0.2
OCR
SDK进行图像文本提取。但是,如果我使用
中文
文本图像并通过
OCR
,则Tesseract不会为我提供
中文
字符,而是我将获得数字和英文字符。但我需要在我使用的图像中显示的
中文
字符。 我如何才能做到这一点?有没有办法获得
中文
字符而不是其他字符?
浏览 7
提问于2013-05-16
得票数 16
回答已采纳
1
回答
计算机视觉识别文本API无法识别繁体
中文
本地容器似乎只支持英语。有人能帮上忙吗? “重要的是,识别文本容器当前只适用于英语。“https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/computer-vision-how-to-install-containers
浏览 32
提问于2019-06-20
得票数 0
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
在r中的
pdf
上执行
ocr
时出错
、
、
、
、
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
1
回答
带有图像的
PDF
文件的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
更新多个列,使其与另一列相等
、
例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。
OCR
0000000001 Yes 100 06000093.
pdf
OCR
0000000004
OCR
0000000006 No 95
浏览 0
提问于2014-03-22
得票数 0
1
回答
两种输入文件类型同时在GNU并行?
、
、
、
然后它将使用tesseract对每个pgm (第二个输入文件类型)执行
OCR
。 export -f generate_pgm PGM="$1" find .{}; parallel --argsep ,,,
ocr
,,, pgm/*.pgm'
浏览 2
提问于2017-07-25
得票数 1
1
回答
将扫描的
pdf
转换为R中可搜索的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。有没有一种方法可以将扫描的
pdf
转换成可读的
pdf
,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
1
回答
检测景观格式的图像,并将其分割成两幅肖像。
、
、
、
、
我已经扫描了
PDF
格式的文件。这些文件包含一页纵向格式和两页横向格式的页面。for i in *.
pdf
; # Créer le fichier
PDF
avec
OCR
ocrmypdf --language fra
浏览 2
提问于2020-04-20
得票数 1
3
回答
将
pdf
的内容读取为字符串
、
、
如何将
PDF
的内容以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。
PDF
来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.
pdf
, encoding: NSUTF8StringEncoding, error: nil) 但是,我认为这是无
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
1
回答
如何在perl中安装
PDF
::
OCR
2模块?
、
、
、
我正在尝试使用perl从扫描的
PDF
中获取文本,所以我在perl中使用了
PDF
::
OCR
2模块,但我无法安装此模块,安装Image::
OCR
::Tesseract模块失败,我使用的是CentOS7,这是我在安装过程中的错误NOT OK reports LEOCHARRE/
PDF
-
OCR
2t
浏览 17
提问于2016-08-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
超好用而且特便宜的中文OCR识别软件——白描
怎么把pdf翻译成中文?三种pdf翻译成中文方法
如何定义OCR识别中文或英文文本的正确率?
pdf翻译成中文怎么弄?分享两个PDF文件翻译中文的方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券