前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式

零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式

作者头像
AIGC部落
发布2024-06-24 15:31:45
800
发布2024-06-24 15:31:45
举报
文章被收录于专栏:Dance with GenAIDance with GenAI

pdf2docx是Python的一个库,可以很方便的将PDF文档转换为word格式,首先安装这个库。

然后在ChatGPT中输入提示词:

你是一个Python编程专家,要完成一个文档格式转换的任务,具体步骤如下:

打开F盘的Books文件夹;

读取里面的PDF文档,用pdf2docx库将其转换为word文档;

注意:每一步都要输出相关信息

使用多线程以加快转换速度;

源代码如下:

import os

from glob import glob

from pdf2docx import Converter

from concurrent.futures import ThreadPoolExecutor, as_completed

# 定义PDF转Word的函数

def pdf_to_word(pdf_file):

# 创建输出的Word文件名

docx_file = pdf_file.rsplit('.', 1)[0] + '.docx'

# 创建一个转换器对象

cv = Converter(pdf_file)

# 将PDF转换为Word

cv.convert(docx_file, start=0, end=None)

cv.close()

print(f'Successfully converted {pdf_file} to {docx_file}.')

# 获取F盘Books文件夹下的所有PDF文件

pdf_files = glob('F:/Books/*.pdf')

# 创建一个线程池

with ThreadPoolExecutor(max_workers=5) as executor:

# 使用线程池中的线程来执行转换任务

futures = {executor.submit(pdf_to_word, pdf_file): pdf_file for pdf_file in pdf_files}

# 打印转换进度

for future in as_completed(futures):

pdf_file = futures[future]

print(f'Finished processing file: {pdf_file}')

运行成功:

图片和表格都成功转换了:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Dance with GenAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档