那些好用的word处理包都无法使用, 难度一下子就上来了..... 好歹有python3 (py2的话,难度更上一层楼.)注: 由于代码都是在内网写的, 无法提供完整的例子了....本文主要偏向于一些xml处理word/xlsx的坑.分析docx 是doc的扩展, xlsx是xls的扩展, 都是为了和其它厂商竞争为了兼容性才出现的标准格式....打开xml文件(直接把xml文件拖到浏览器就行) 会看到一个类似如下的格式这是一个xml文件, 我们可以使用 python 的xml.dom.minidom 来解析这个文件由于是zip文件的, 所以得先用...(elementree就没得, 巨坑, 啊, 不剧透了.)所以我们可以遍历 w:t 匹配值, 如果匹配上了, 就返回 w:t 的最近的w:p (段落) 只有w:t不方便, 通常建议直接复制一个段落....只是多个文件(sharedStrings.xml)而已. 所以这里就不演示了.总结1. 虽然python自带的xml能操作docx和xlsx文档, 但不建议这么做, 太痛苦了. 2.