首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在图像中定位文本

在图像中定位文本
EN

Stack Overflow用户
提问于 2008-08-05 03:04:44
回答 4查看 5.9K关注 0票数 32

我目前正在做一个项目,我的目标是定位图像中的文本。到目前为止,OCR文本还不是我的意图。我希望基本上获得图像中的文本边界。我正在使用AForge.Net图像组件进行操作。在某种意义上有什么帮助吗?

更新2/5/09:从那以后,我在我的项目中走了另一条路。不过,我确实尝试过使用MODI (Microsoft Office Document Imaging)获取文本。它可以让你轻松地对图像进行OCR,并从中提取文本。

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2008-08-05 03:24:28

这是一个活跃的研究领域。关于这个主题的学术论文真的很多。这将很难给你帮助,特别是没有更多的细节。您是否在寻找特定类型的文本?字体?仅限英语?你熟悉学术文献吗?

“文本检测”是任何OCR (光学字符识别)系统中的标准问题,因此在处理它的互连网上有许多位代码。

我可以从google开始列出成堆的链接,但我建议您只需搜索“文本检测”并开始阅读:)。还有大量的示例代码可用。

票数 14
EN

Stack Overflow用户

发布于 2008-08-05 06:00:46

对于该领域的研究人员来说,识别图像中的文本确实是一个热门话题,但直到captcha's成为防御垃圾邮件机器人的“标准”时,才开始失去控制。为什么要使用验证码作为保护呢?嗯,因为很难定位(和阅读)图像中的文本!

我提到验证码的原因是因为最大的进步*是在这个很小的领域,我认为你的解决方案可以在那里找到最好的解决方案。尤其是因为验证码实际上是在杂乱的图像中定位文本(或类似文本的内容),然后尝试正确读取字母。

因此,如果你能找到自己的a good open source captcha breaking tool,你可能已经拥有了继续你的探索所需的一切……

您甚至可以丢弃处理字符识别本身的最困难的代码,因为这些OCR用于读取扭曲的文本,这是您不需要做的事情。

*:“非研究人员”在可见、可用和实用信息方面的进步

票数 3
EN

Stack Overflow用户

发布于 2010-06-23 13:49:10

如果你可以使用在线应用编程接口,http://www.wisetrend.com/wisetrend_ocr_cloud.shtml上的应用编程接口除了可以进行光学字符识别外,还可以进行文本检测。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1848

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档