首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >【Python自动化办公】分享几个好用到爆的模块,建议收藏!

【Python自动化办公】分享几个好用到爆的模块,建议收藏!

作者头像
用户6888863
发布2023-03-01 20:07:07
发布2023-03-01 20:07:07
4950
举报
文章被收录于专栏:AI篮球与生活AI篮球与生活

今天小编来给大家推荐几个在自动化办公领域当中非常好用的Python模块,可以帮助大家在工作当中及大地提高效率,避免重复机械化地操作流程。

Pathlib

涉及到文件系统操作的时候,相信不少人仍然在使用Python当中的OS模块,相比较之下,Pathlib模块有着不少优势,我们来看几个简单的案例

删除与创建目录

例如我们可以来创建与删除目录,代码如下

代码语言:javascript
复制
from pathlib import Path

currentPath = Path.cwd()
makePath = currentPath / 'pythonPractice'
makePath.mkdir()

那么同样的,删除目录的代码为

代码语言:javascript
复制
currentPath = Path.cwd()
delPath = currentPath / 'pythonPractice'
delPath.rmdir()

获取目录

例如我们想要获取当前所在的目录的路径,代码如下

代码语言:javascript
复制
currentPath = Path.cwd()
print(currentPath)

以及电脑用户所在的目录

代码语言:javascript
复制
homePath = Path.home()
print(homePath) 

路径的拼接

例如我们想要拼接出桌面的绝对路径,代码如下

代码语言:javascript
复制
Path(Path.home(), "Desktop")

也可以是

代码语言:javascript
复制
Path.joinpath(Path.home(), "Desktop")

目录文件的判断

针对指定的路径,我们能够来判断是否是文件夹以及是否是一个文件,代码如下

代码语言:javascript
复制
input_path = r"指定的路径"

if Path(input_path ).exists():
 if Path(input_path ).is_file():
  print("是文件哦!")
 elif Path(input_path ).is_dir():
  print("是文件夹哦!")
else:
 print("路径给的不对!")

glob

Python当中的glob模块主要是用来查找符合特定规则的目录和文件,并将搜索到的结果返回到一个列表当中去。

由于该模块支持使用正则通配符来进行查找,因此使用起来也是特别的方便,我们来看一下简单的案例,

代码语言:javascript
复制
path1 = r".\[0-9].jpg"
glob.glob(path1)

outut

代码语言:javascript
复制
['.\\1.jpg', '.\\2.jpg', '.\\3.jpg', ......]

其中经常会用到的通配符有

  • *:匹配0个或者多个字符
  • **:匹配所有文件、目录,子目录和子目录里面的文件
  • []:匹配指定范围内的字符,例如[1-9]匹配的是1-9以内的字符
  • [!]:匹配不在指定范围内的字符

我们再来看几个案例,代码如下

代码语言:javascript
复制
for fname in glob.glob("./*.py"):
    print(fname)

上面的代码打印出了当前目录下的所有py后缀的文件,再来看一下案例

代码语言:javascript
复制
for fname in glob.glob("./file[!0-9].py"):
    print(fname)

上面代码则是打印出了以filename开头的非数字符号的py文件。

PDF转成Word文档

最后我们来讲讲如何实现将PDF文档转换成Word格式的文档,用到的模块是pdf2docx,我们先用pip命令来将该模块安装一下

代码语言:javascript
复制
pip install pdf2docx

我们来实践一下,代码如下

代码语言:javascript
复制
from pdf2docx import Converter

cv = Converter(r"pdf文档的具体路径")
cv.convert("test.docx", start=0,end=None)
cv.close()

如果是页面元素比较简单的文档,pdf2docx模块处理一下是完全够用了,但是有些时候PDF文档当中个别页面非常的花里胡哨,转换成Word格式的文档之后则会显得有点凌乱。

最后我们还能够针对指定的页数进行转换,例如只是针对文档当中的奇数页进行操作,代码如下

代码语言:javascript
复制
from pdf2docx import Converter

cv = Converter(r"pdf文档的具体路径")
cv.convert("test.docx", pages=[1, 3, 5, 7])
cv.close()
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 关于数据分析与可视化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Pathlib
    • 删除与创建目录
    • 获取目录
    • 路径的拼接
    • 目录文件的判断
  • glob
  • PDF转成Word文档
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档