我在文件夹中有一些.png文件,我需要逐个读取它们,并将所有文件生成的文本连接到一个变量中。我使用了下面的代码: filenames <- list.files(path = "C:/Users/tmpxk9/Documents", pattern="*.png")
for (i in seq_along\Users\tmpxk9\Documents\filenames[i]
我要从多个PDF文件中提取文本。PDF文件包括文本和一些图像,甚至一些页面是扫描的页面(我假设扫描的页面就像图像)。我按照下面的命令从PDF文件中提取文本。我的问题是,如何使用条件编辑命令,以检查每个页面是否包含任何图像,然后从图像中提取文本。如果你能帮助我,我将不胜感激。lst_all_text = []
for folde