我一直在实现一个Android OCR工具,只使用tesseract到ocr数字。到目前为止,它用普通的数字字体提供了相当高的精度。然而,当涉及到7个段数字(那些在LCD上发现的)时,准确性是可怕的。
我试着裁剪我的图像,白名单的0到9和一些图像处理也无济于事。有什么关于如何提高准确性的想法吗?或者也许一些关于训练tesseract的特定7段数字的技巧肯定会对我有很大的帮助。
提前谢谢。
发布于 2015-10-07 06:01:53
您可以在以下位置找到7个分段的训练数据:
https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital
在相同的存储库中还有一个样例python代码。
https://stackoverflow.com/questions/13630779
复制相似问题