目录
前言
读取Word内容
NPOI
NPOI安装
NPOI提取Word内容
用Costura.Fody打包DLL
python-docx
读取PDF内容
python-docx自动生成Word
全局字体...但是Office不能够, 并不是没有比Office更好的东西, 这是一个历史残留问题, 就像牙膏厂CPU里面, 那些莫名其妙的字段一样....总之, 这里通过使用一些库, Python的python-docx, C#的pdfbox和npoi, 来让对Word和PDF的处理变得更加自动化一些....-----
读取PDF内容
同样, 这次用的是C#的库, 名为Pdfbox....Microsoft.Office.Interop.Word是巨硬提供的com组件, 那么要如何使用它呢, 你要先装Windows, 再装Office, Office2013对应这个com组件的15.x版本