我正在尝试制作一个“测验扫描器”,它使用OCR在线扫描测验,这样我就可以自己从在线来源汇编测验,以便能够离线回答它们。我厌倦了复制和粘贴的事情,只使用OCR代替。 我对光学字符识别部分没有问题,因为我现在遇到的问题是,我需要将问题从选择中分离出来,从正确和错误的选择中分离出来。下面是我尝试分离它们的一个过于简化的代码。 我需要将它们分开,因为我想将其导出到excel中的电子表格中。真的需要你的帮助,一如既往的堆栈溢出社区 import re
scannedmcq = 'Insert Question Here @ A(correct) > B > C > D
下午好,我在我的项目中有一个问题,这是PDF压缩,过程如下:提取图像从一个PDF Hang OCR压缩股票OCR +合并图像和转换PDF每页结合所有生成的pdf格式与光学字符识别,光学字符识别PDFcon作为最终产品之一。我的原始文件大小为11MB,压缩后为4.2MB。整个过程运行得很完美,但我遇到的问题是OCR过程的速度。我在网上查看,我看到了一种方法来规避该过程,这是获得的原始PDF的文本层,并将其传递到最终的PDF是压缩的,尝试一些代码,如删除所有图像的PDF和单独与文本层,并插入我的压缩图像,但问题相比于上面提供的正常过程中,该文件的重量增加了超过4.2MB,这对我来说并不方便。当我寻
我正在尝试使用android ML Kit文本识别库进行文本识别,但在运行时遇到错误,没有返回任何文本。错误: W/TextNativeHandle: Native handle not yet available. Reverting to no-op handle.
W/DynamiteModule: Local module descriptor class for com.google.android.gms.vision.dynamite.ocr not found.
I/DynamiteModule: Considering local module com.google.and
我在许多网站上读到,他们说盖特支持西班牙语,但我没有找到如何用门来分析西班牙语文本。我试过使用树格,但是我得到了错误: treetagger \tree-tagger-西班牙语-gate“:CreateProcess error=193,%1 no es una aplicación Win32 válida
我也尝试过使用OpenNLP,但是我在晚餐中找到了西班牙语的模型(记号器、块等等),我只找到了荷兰语、德语和英语。
另外,我需要识别句子的主语和谓语。如果我错了,请纠正我,但是我认为我可以用OpenNLP来完成,因为可以用树库解析器或MuNPEx插件来识别NP(名词短语)和VP(动词短语
我在我的项目中使用AspriseOCR从图像中识别文本。aspriseOCR.jar文件被正确地配置为我的Eclipse库,但是得到了下面的错误。有人能指点我怎么解决这个问题吗?
java.lang.UnsatisfiedLinkError: no AspriseOCR in java.library.path
at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1860)
at java.lang.Runtime.loadLibrary0(Runtime.java:845)
at java.lang.System.loadLibrary