我有一个100+手写页面的pdf格式,我需要转换为机器可读的文本。到目前为止,我已经尝试了tesseract和一个免费的在线工具,但没有成功。结果似乎是胡言乱语。
tesseract myscan.png out -l eng
我已经附上了一个示例页面。它包含文本、数学符号(例如,整数符号)和偶尔的图片。
也许我用错了tesseract?有没有人能试着从这上面得到一个好的输出呢?
可以在新图片中看到pdf.png,但在新图片中看不到字符串“Hello
public void generateImage() throws Exception{
int width = 220;
int height = 50;
BufferedImage image = new BufferedImage(width,height,BufferedImage.TYPE_INT_RGB);
Graphics g = image.getGraphics();
g.setColor(new Color(255,255
我想创建一个分类器,以便通过捕获的图像来识别昆虫。在第一次,我使用HuMomemnts,但不同分辨率下捕获的图像给出了不正确的结果,因为HuMoments的比例是不同的。在网上搜索后,我发现使用SIFT和SURF可以解决我的问题,因此,我试着看看当我使用SIFT时会发生什么。下面的前两张图片属于不同的昆虫种类。结果很奇怪,因为400个特征中的所有特征都是匹配的(见第三张图)。
int main()
{
Mat src = imread(firstInsect);
Mat src2 = imread("secondInsect");
if(src.empty()