将pdf转换为txt文件的函数的输出重定向到Python中的新文件夹,可以通过以下步骤来完成:
import os
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.pdfpage import PDFPage
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from io import StringIO
def pdf_to_txt(input_path, output_path):
rsrcmgr = PDFResourceManager()
codec = 'utf-8'
laparams = LAParams()
with StringIO() as output_string:
with TextConverter(rsrcmgr, output_string, codec=codec, laparams=laparams) as device:
with open(input_path, 'rb') as input_file:
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in PDFPage.get_pages(input_file):
interpreter.process_page(page)
output_text = output_string.getvalue()
with open(output_path, 'w', encoding='utf-8') as output_file:
output_file.write(output_text)
# 调用函数进行pdf转换为txt,并输出到新文件夹
input_pdf = 'path/to/input.pdf'
output_txt = 'path/to/output_folder/output.txt'
pdf_to_txt(input_pdf, output_txt)
以上代码使用了pdfminer库来进行pdf解析和文本提取,并将提取到的文本保存到指定的txt文件中。
以上是将pdf转换为txt文件的函数的输出重定向到Python中的新文件夹的完整步骤。请根据自己的需求和具体情况进行调整和使用。
领取专属 10元无门槛券
手把手带您无忧上云