下午好,我在我的项目中有一个问题,这是PDF压缩,过程如下:提取图像从一个PDF Hang OCR压缩股票OCR +合并图像和转换PDF每页结合所有生成的pdf格式与光学字符识别,光学字符识别PDFcon我在网上查看,我看到了一种方法来规避该过程,这是获得的原始PDF的文本层,并将其传递到最终的PDF是压缩的,尝试一些代码,如删除所有图像的PDF和单独与文本层,并插入我的压缩图像,但问题相比于上面提
我试图用解析我的pdf,但是我得到了这个错误# from matplotlib import pyplot as pltfrom tabula import read_pdf_table# Converting first page into JPG
with Image(filename="ed.pd