首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >对比几家比较优质的PDF转Word SDK

对比几家比较优质的PDF转Word SDK

原创
作者头像
Youna
修改于 2023-11-23 09:40:14
修改于 2023-11-23 09:40:14
1.1K0
举报
文章被收录于专栏:ComPDFKit tutorialsComPDFKit tutorials

Hello 大家好,我是Youna。我们打工人平时办公免不了要对一些文档格式行转换。我们将探讨几款主流的 PDF 转 Word SDK,分析它们在我们打工人的实际工作中所呈现的优势与劣势。

1. Solid:老牌的 PDF to Office 转档库,有几十年的积累。

2. Aspose: 支持非常多的文件格式互转,也包含PDF 转 word 。

3. Foxit:自主研发 PDF,PDF to Office 也是最近刚推出的。

4. ComPDFKit: 最近一家新锐公司,更新频率很高。

话不多说,直接对比一下 PDF 转 word 的效果。

对比表:

我分别挑选了一些不同特征的文档进行测试,其中包括页数多,包含表格,图文混排。涉及到论文,cad制图,金融等领域,先看一下这些文档的转档耗时。

12个文档中,foxit 有三个文档没有转换成功,其他三个 SDK 全部文档都转换成功了。Aspose  SDK 因为试用原因只能转换前4页,但是有些情况下对比其他三个转了全部页面的速度还慢。综合下来ComPDFKit的转换速度最快。接下来我们看一下具体效果。

效果文档 - 651页文档.pdf

原文档

各SDK厂商转档对比

* ComPDFKit:基本没啥问题,但是字体和原文档有区别

* 福昕:可以看到会有一些小的识别错误,主要在跨行的时候,存在部分粗体识别错误的情况

* Solid: 基本也没啥问题,没什么错误,不过也存在字体区别。

效果文档 - 证券文档.pdf

原文档:

各SDK厂商处理结果:

* ComPDFKit: 整体排版正确,第二页的部分字体会出现拖影现象,部分文字会出现超出文本框的现象。

* foxit:整体排版正确,第二页的部分字体会出现拖影现象,第一页的图表会出现超出文本框的现象。

* Solid:整体排版正确,第一页的图表会出现超出文本框的现象,第一页的页脚图片透明度识别错误。

Aspose:整体排版正确,第二页的部分文字下有投影。

效果文档 - 论文2.pdf

原文档:

各SDK厂商处理结果:

* ComPDFKit: 在公式部分的转换都是转换了文档中原有的字符,所以会出现乱码。

foxit:并没有区分小标题的粗体与正文的细体,且部分文本用图片代替,排版相对而言比较混乱。

Solid: 对公式部分的支持比较好,但是部分符号使用了形变后的图片代替,比较影响观感。

效果文档 - 图文混排.pdf

原文档:

各SDK厂商处理结果:

图文混排版面都保持的不错

ComPDFkit, foxit, solid 文字的字体和原文档都不太解决,aspose 最接近, 但是aspose 的背景图片缩放不对。ComPDFkit有几个字最上方被裁掉了。

* ComPDFKit: 

* foxit: 

* Solid:

* Aspose:

效果文档 - 图文带简单表格.pdf

* foxit 的文字背景形状变了,变成了不规则的。

* aspose 背景图片变小了。

* ComPDFKit 的时间有一部分被裁掉了。

* Solid 效果良好。

原文档:

各SDK厂商处理结果:

* ComPDFKit:

* foxit:

* Solid:

* Aspose:

总结

这几家 SDK转换成的 Word都各有优缺点,应该是pdf转成 word 的算法侧重点不同。可以根据自己的项目情况和项目预算选择合适的SDK公司。**

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
【Redis基础】Redis新数据类型(Bitmaps,HyperLoglog,Geospatial)命令简介与案例演示
Bitmaps 并不是实际的数据类型,而是定义在String类型上的一个面向字节操作的集合。因为字符串是二进制安全的块,他们的最大长度是512M,最适合设置成2^32个不同字节。 bitmaps的位操作分成两类:1.固定时间的单个位操作,比如把String的某个位设置为1或者0,或者获取某个位上的值 2.对于一组位的操作,对给定的bit范围内,统计设定值为1的数目(比如人口统计)。 bitmaps最大的优势是在存储数据时可以极大的节省空间,比如在一个项目中采用自增长的id来标识用户,就可以仅用512M的内存来记录40亿用户的信息(比如用户是否希望收到新的通知,用1和0标识)
小尘要自信
2023/10/10
3620
你说啥?Redis中除了五大数据类型,还有特殊数据类型!
可以用于基于地理位置的业务场景。比如:查询两地之间的距离,方圆几里存在的地理位置等等。
爪哇缪斯
2023/05/10
2750
你说啥?Redis中除了五大数据类型,还有特殊数据类型!
Redis6发布订阅及Redis新数据类型
Redis 发布订阅 (pub/sub) 是一种消息通信模式:发送者 (pub) 发送消息,订阅者 (sub) 接收消息
大忽悠爱学习
2021/11/15
5760
【Redis】Redis 高级数据类型Bitmaps、HyperLogLog、GEO
对于bitmap,我们取值的时候,需要知道bit的位置,改值的时候,需要知道位置和修改结果。取值和修改的操作变得复杂了一些,但是节省了存储空间,属于时间换空间。其实redis并没有提供bitmap这种数据类型,只是提供了对string类型操作bit的接口
终有救赎
2023/10/24
3040
【Redis】Redis 高级数据类型Bitmaps、HyperLogLog、GEO
分布式之redis的三大衍生数据结构
说起redis的数据结构,大家可能对五大基础数据类型比较熟悉:String,Hash,List,Set,Sorted Set。那么除此之外,还有三大衍生数据结构,大家平时是很少接触的,即:bitmaps、hyperloglog、geo 另外,我觉得,这三个数据结构,只能说是锦上添花。真正在项目中,我还真没用过。 下面大家来看看这三大数据结构的定义和用途
Java_老男孩
2019/12/02
5330
Redis源码阅读(一)总体概览
”昨夜西风凋碧树。独上高楼,望尽天涯路”,我们先从Redis的特性、用途及数据类型这几个方面介绍下Redis,对其有个总体上的认知。
星沉
2022/01/28
8710
【Redis】四大特殊的数据类型之 HyperLogLog
我们都知道 Redis 提供了丰富的数据类型,特殊的有四种:BitMap、HyperLogLog、Geospatial、Stream。
sidiot
2023/08/31
4730
Redis 数据结构扩展
注意:没有删除命令 它的本质是 zset (type locations)
BUG弄潮儿
2021/07/22
3260
[新星计划]一文快速搞定Redis_数据类型及JavaApi操作
一文快速搞懂系列讲究快速入门掌握一个新的大数据组件,帮助新手了解大数据技术,以下是系列文章:
Maynor
2021/06/22
4760
[新星计划]一文快速搞定Redis_数据类型及JavaApi操作
Redis 的 3 个高级数据结构
来源:https://www.jianshu.com/p/87a576d29d4b
芋道源码
2019/10/29
5830
Redis 的 3 个高级数据结构
Redis 新数据类型
命令大小写都可以,如果你只想单纯看 API,不想看例子,请移到最下面的 指令总结。
用户9615083
2022/12/25
6860
七天玩转Redis | Day3、Redis地理位置、基数统计、位图场景使用详解
博主简介👨🏼‍⚕️:国内某一线互联网公司Java工程师👨🏼‍💻,业余自媒体创作者💻,CSDN博客专家🏆,Java领域优质创作者📕,华为云享专家🥇,华为HDZ核心成员👨‍💼,曾发表并出版ISEAE信息科学国际论文,全网累计发表技术博客60余万字📒,公众号【码猿编程日记】作者,坚信每一次敲动键盘都能让生活变得更智能,世界变得更有趣! 课前答疑:很多小伙伴问我零基础或者根本没有使用过Redis,可以学习嘛?当然是可以的!充分考虑到小伙伴们的学习程度有所不同,所以本次课程的所有操作都是在Windows环境下进行
灰小猿
2022/05/05
5060
七天玩转Redis | Day3、Redis地理位置、基数统计、位图场景使用详解
【Redis 系列】redis 学习五,多学习一些 redis 的三种特殊数据类型
返回一个或者多个GEOHASH 表示的元素, 返回 11 个字符 Geohash 字符串
阿兵云原生
2023/02/16
3010
深入浅出Redis(十一):Geosptial、Hypeloglog、Bitmap、Bloom Filter布隆过滤器
Redis提供丰富的数据结构来解决各种场景下的问题,前段时间的一篇文章深入浅出Redis(一):对象与数据结构已经深入浅出的说明Redis中的常用基础对象与数据结构
菜菜的后端私房菜
2024/09/20
4580
学习 Redis 基础数据结构,不讲虚的。
很多在近期找过工作的同学一定都知道了,背诵八股文已经不是找工作的绝对王牌。企业最终要的是可以创造价值,或者首先需要干活的人,所以实战很重要。今天这篇文章就是给大家分享一下如何在我们实战生产中使用 redis。
JavaPub
2024/02/07
1530
学习 Redis 基础数据结构,不讲虚的。
你知道redis提供的其他功能吗?快来看看吧!
1. 字符串类型1.1 常用APISET key value //存入...
友儿
2022/09/11
4530
Redis 狂神说
后来,随着访问量的上升,几乎大部分使用 MySQL架构的网站在数据库上都开始出现了性能问题
Remember_Ray
2021/04/07
1.1K0
Redis 狂神说
【Redis】005-Redis三大特殊数据类型:geospatial地理位置、HyperLogLog基数统计、Bitmaps位图
将指定的地理空间位置(纬度、经度、名称)添加到指定的key中。这些数据将会存储到sorted set这样的目的是为了方便使用GEORADIUS或者GEORADIUSBYMEMBER命令对数据进行半径查询等操作;
訾博ZiBo
2025/01/06
1910
【Redis】005-Redis三大特殊数据类型:geospatial地理位置、HyperLogLog基数统计、Bitmaps位图
Redis系列:Redis的数据结构
Redis 的基本数据类型包括:二进制安全字符串 String、Hashes(哈希)、Lists 列表、Sets 集合 和 Sorted sets 有序集合;
栗筝i
2022/12/01
4940
6.Redis新数据类型
现代计算机用二进制(位) 作为信息的基础单位, 1个字节等于8位, 例如“abc”字符串是由3个字节组成, 但实际在计算机存储时将其用二进制表示, “abc”分别对应的ASCII码分别是97、 98、 99, 对应的二进制分别是01100001、 01100010和01100011,如下图
一个风轻云淡
2022/11/13
3410
6.Redis新数据类型
推荐阅读
相关推荐
【Redis基础】Redis新数据类型(Bitmaps,HyperLoglog,Geospatial)命令简介与案例演示
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档