我正在开发一个使用tesseract OCR识别文本的Android应用程序,现在我遇到了一个问题,在不同的智能手机上,图像会以不同的方式旋转,所以在一部手机上,它立即处于横向模式,而在另一部手机上,它处于纵向模式。所以现在我想要智能地旋转图像,以便Tesseract可以识别文本。这只在两个可能的选项中的一个中,但由于用户拍照,它可能在任一选项中。我不希望用户每次都必须以相同的格式拍摄照片,我希望旋转它,使其适合需要,如果可能的话,不会有太多的性能损失。
带有autorotate的Tesseract库似乎无法以这种方式为我工作。任何人都知道如何解决这个问题。
谢谢
发布于 2014-12-15 21:34:52
如果这个问题仍然与您相关:也许您可以提取图像的exif数据,以获得其方向?
另外,这篇文章也许可以帮助你:Combined Orientation and Script Detection using the Tesseract OCR Engine。
发布于 2015-01-21 03:40:53
如果您不介意卷起袖子,http://www.leptonica.org/可能是评估字形(尚未检测为文本的原始Pix )和确定方向的好选择。我看过Leptonica的Android绑定的引用。
https://stackoverflow.com/questions/18487398
复制相似问题