温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
有没有朋友和我一样,想用Python处理PDF是非常的懵,因为网上一搜就有很多很多的库,而且名字都长得差不多,P I PDF p Mo PDF, 光听这些名字就让人头大对不对?你说的对,你说的对,今天呢,我们就用这一个视频来帮大家做出正确的选择。首先我们要明确到底什么是PDF?好,PDF的全称呢?是便携式文档格式,PDF从一开始就是为了展示显示文档而诞生的,而不是为了编辑文档而诞生的。在PDF出现之前呢?跨平台共享文档是一场噩梦。你可以想一想,你把一个用特定字体和排版软件制作的文档发给别人,如果他的电脑上没有这样的字体和软件,打开后就是一团乱码,面目全非了。那PDF通过冻结文档的最终形态呢?完美解决了格式错乱和依赖缺失的问题。牛逼PDF作为一种。
01:00
文档格式它是有标准的,它的官方技术规范呢,是由国际标准化组织发布的ISO三万二两千系列标准,这份标准呢,就是PDF格式的终极说明书,规定了如何编写、解析和处理PDF,感兴趣的朋友呢,可以去看一看这份文档,但是呢,我意外的发现这个标准文档它竟然是收费的,而且价格还挺高。那么问题来了,有没有一个库能全部实现这个官方标准呢?答案是不存在。而GPT给的原因呢,是这个想法在商业上不切实际,存在很多的历史包袱啊,大家有其他原因也可以打在咱们的弹幕里面。呃,所以这就造成了目前每个库都是实现了这个标准的一部分,这些所有的库共同组成了用Python处理PDF的工具箱,那每个库具体是什么功能呢?我们来一起看一下,每个库呢,都有他们自己的功能。大家可以。
02:00
你把这一页点赞收藏啊,以备我这里呢把一些典型的库给大家总结下来了,大家可以在这一页点个暂停或者是截图收藏一下,以后用Python处理PDF的时候呢,可以拿出来查看。在这些所有库里呢,我自己最常用的是这个POMPDF,它尽可能的实现了PDF这个标准化的文件里的技术规范,对于关注本频道的朋友呢,PMPDF有一个缺点就是它的学习成本比较高啊,因为它毕竟是一个专业的库,所以呢这里给大家推荐一个小专用的库GOPDF,它的主要特点呢就是简单易学,几乎所有的功能呢都可以通过一行代码来实现,好安装呢也是通过这样一个命令啊,直接用PI就可以下载下来,和其他的库都一样啊,使用呢,有一些代码演示啊,比如说第一个PDF转word啊,一行代码就可以实现了,其次呢,有一些分割PDF啊,再有呢,就是。
03:00
合并PDF,大家看它都可以通过一行代码来进行实现,是不是非常的简单呀,而且这个库呢,还是完全免费使用啊,当然它也是一个开源项目,如果大家对呃开发比较感兴趣的朋友也可以参与到这个项目的开发。好,这就是本期视频的全部内容,喜欢视频也可以点赞,我们下个视频再见。
我来说两句