经过大量的实验,我仍然不能让下面的脚本工作。我需要一些关于如何诊断这个特定Perl问题的指导。提前谢谢。
此脚本用于测试Office2007OCRAPI的使用:
use warnings;
use strict;
use Win32::OLE;
use Win32::OLE::Const;
Win32::OLE::Const->Load("Microsoft Office Document Imaging 12\.0 Type Library")
or
die "Cannot use the Office 2007 OCR API";
my $miD
我使用了下面的 of EAST (高效、准确的场景文本检测器)来识别和绘制多幅图像中文本周围的包围框,它工作得非常好!
然而,OCR的下一个步骤(我正在使用pytesseract来提取这些图像的文本并将它们转换为字符串)是可怕的失败。使用--oem和--psm的所有可能配置,我无法让pytesseract检测到看起来非常清晰的文本,例如:
识别的文本在图像下面。虽然我已经应用了对比度增强,也尝试了膨胀和侵蚀,但我无法让识别文本。这只是许多图片中的一个例子,其中的文本更大、更清晰。任何关于转换、信任或其他库的建议都是有帮助的!
更新:在尝试了高斯模糊+ Otso阈值处理之后,我能够在白