腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
为什么我用魔杖从pdf中提取图像jpg,它会在文本上变成黑色背景?
、
、
、
、
我需要将它们转
换为
jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在
word
转
换为
pdf文件的文件中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?已将pdf转
换为
jpg
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
1
回答
c# -无法使用tessnet2和Tesseract-c#从图像中读取带圆圈的文本
、
、
、
我正在尝试编写代码,将文本从jpg转
换为
控制台。我曾经写过: tessnet2和Tesseract-
OCR
(在c#中)。下面是我的代码: tessnet2.Tesseract
ocr
= newtessnet2.Tesseract();
ocr
.Init(@"C:\tessdata", "eng"
浏览 15
提问于2018-02-11
得票数 1
2
回答
将hOCR转
换为
HTML
、
、
、
、
我正在寻找一个在python中实现的工具或想法,它将hOCR文件(由应用程序在tesseract中生成)转
换为
html表。1'> <p class='
ocr
_par' dir='ltr> <span class='
ocr
_line
浏览 5
提问于2015-06-24
得票数 12
3
回答
tesseractengine3 .net包装器的简单示例
我正在尝试做一些简单的
OCR
任务,我仍然在寻找一个免费的库。
浏览 5
提问于2012-07-30
得票数 3
2
回答
黑名单字符不会被Tesseract
OCR
忽略
、
、
但我希望
OCR
忽略数字字符。_tesseract->SetVariable("tessedit_char_blacklist", "0123456789");如上文所示,
OCR
将12
转
换为
fl,这是我不想要的。我希望12被
OCR
忽略。
浏览 2
提问于2013-03-04
得票数 3
回答已采纳
2
回答
Tesseract的hOCR输出真的包含每个字符的边框和可信度吗?
、
、
<span class='
ocr
_line' id='line_1_1' title="bbox 78 61 456 97"><span class='
ocr
_
word
' id='
word
_1_1'> <span class='
ocr
_
word
' id='
word
_1_2' title="bb
浏览 12
提问于2013-04-05
得票数 7
回答已采纳
3
回答
如何在c#中将
Word
文档的页面拆分成单独的文件
、
我有一个
OCR
程序,可以将图像转
换为
word
文档。
word
文档包含所有图像的文本,我想将其拆分成单独的文件。谢谢
浏览 16
提问于2012-08-01
得票数 0
4
回答
如何在c#中将PDF文件转
换为
WORD
文件
、
、
、
有没有人知道一个.Net组件,可以通过编程将PDF转
换为
Word
或RTF?我不想使用
OCR
和Adobe相关解决方案。
浏览 1
提问于2011-04-20
得票数 7
1
回答
用<strong>提取ElementTree文本
、
、
In the Python code:In the XML file:
ocr
_
word
= line.findall(".//{http://www.w3.org
浏览 1
提问于2016-11-15
得票数 1
3
回答
将扫描的PDF转
换为
可搜索的PDF ( R)
、
、
、
、
读取扫描PDF results <- tesseract::
ocr
_data("example.pdf", engine = "eng&
浏览 22
提问于2021-09-01
得票数 1
2
回答
IVI
ocr
测试集
、
、
大家好,我有一个关于C#的
OCR
Tesseract (tessnet2)的问题,它能找到caractère IVI而不是"M“,你能帮我吗?tessnet2.Tesseract
ocr
= new tessnet2.Tesseract(); List<tessnet2.
Word
> result =
ocr</
浏览 4
提问于2013-02-21
得票数 2
1
回答
如何使用
ocr
从图像中获取时间和日期?
、
、
、
我正在使用在我的项目:中引用的
ocr
private void test() Bitmap image = new Bitmap(@"d:\timessquare.jpg");
ocr
.SetVariable); // To use correct tessdata L
浏览 4
提问于2013-09-05
得票数 0
回答已采纳
2
回答
tessnet的C# .net包装器
、
、
、
我尝试为tessnet
OCR
库编写包装器。我收到一个错误,说“无法封送‘返回值’:泛型类型不能封送。”对于此代码节,我的包装器类是{ public static extern List<
浏览 0
提问于2011-02-08
得票数 0
回答已采纳
1
回答
使用System.AccessViolationException的Tessnet2 close程序
、
Bitmap image = new Bitmap(@"C:\OCRTest\test.jpg"); tessnet2.Tesseract
ocr
= new tessnet2.Tesseract();
ocr
.Init> result =
ocr
.DoOCR(
浏览 13
提问于2019-07-08
得票数 0
1
回答
Tesseract图像到文本
、
、
、
、
我使用以下代码:tessnet2.Tesseract
ocr
= new tessnet2.Tesseract();
ocr
.I
浏览 7
提问于2013-12-09
得票数 0
3
回答
使用R在PDF中存储Tesseract输出
、
、
、
options = list(tessedit_pageseg_mode = 1, text0 <- tesseract::
ocr
浏览 9
提问于2021-08-29
得票数 1
2
回答
Tesseract:如何导出文本和边框?
、
、
、
、
我想将文档图像转
换为
XML,并导出在页面中找到某个单词的位置。PSM_AUTO_OSD); while(it->Next(tesseract::RIL_
WORD
) int top, bottom, left, right; it->BoundingBox(tesseract::RIL_
WORD
, &left, &top, &right对于每个框,我从原始图像中切出
浏览 0
提问于2012-07-07
得票数 3
回答已采纳
4
回答
Tessnet2 System.AccessViolationException
、
、
我的代码是
ocr
.Init(@"C:\tessdata", "eng"
浏览 9
提问于2014-01-12
得票数 1
9
回答
Tesseract
OCR
简单示例
、
、
嗨,你们谁能给我一个简单的例子来测试Tesseract
OCR
,最好是在C#中。
ocr
.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only
ocr
.Init(@"C:\tessdata\", "eng", false); // To use correct tess
浏览 5
提问于2013-05-17
得票数 28
2
回答
如何在C#中与MODI ()串行地进行
OCR
、
、
、
、
我在文件夹中将文档扫描为.jpg图片,并希望在C#中对该文件夹中的每个文档依次执行
OCR
操作。// or // ImageFormat.Jpeg.ToString() try //
OCR
MODI.Document md = new MODI.Document(); md.
OC
浏览 1
提问于2012-06-14
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
word转换为pdf该怎么操作?word转pdf方法介绍
Word文档怎么转换为PDF?免费批量Word转PDF方法分享
WORD怎么转换为PDF?WORD文档转PDF文件的技巧分享
pdf怎么转换为word文档?简单三步搞定pdf转word
图片转word怎么转?图片转word教程速速收藏!
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券