pdf转换成word文档后格式不对
将 pdf 转换为 word 文档看起来像是简单的一步,但是很多人发现结果很乱,文本会移动,图片跑位,表格断裂,你打开新的 .docx 文件期望看到整齐的 pdf 副本...,却看到句中换行,奇怪的字体,以及错位的列,这是因为 pdf 注重固定布局,而 word 使用流式文本,转换工具试图解释 pdf 的布局并将其重建为可编辑内容,当 pdf 使用复杂格式,非标准字体,或者内容采用绝对定位而非逻辑阅读顺序时...为什么 pdf 和 word 不同
pdf 保留文本,图片,形状的精确位置,像是一张页面快照,word 文件用于编辑会根据页面设置和样式重新排列文本,当转换器读取 pdf 时它试图将固定位置映射为段落和文本片段...如何改善转换结果
选择好的转换器,付费工具和新版办公套件通常比免费或旧版转换器效果好,仅在必要时使用 ocr,如果 pdf 是扫描件,使用光学字符识别然后仔细校对,创建 pdf 时尽量嵌入字体或导出时包含字体...,如果你能控制源文件,导出 pdf 时启用标签和结构,转换后手动检查并修正标题,列表和表格,对于复杂布局,考虑复制纯文本在 word 中重新排版而非完全依赖自动转换.