poi官网地址:https://poi.apache.org/。目前最新版本为 22年1月14日发布的POI5.2.0。...3.1 poi版本和依赖引入
我们使用的是4.1.0版本的poi,引入的依赖如下:
3.2 docx文件内容读取
通过XWPFWordExtractor读取文档内容:
import org.apache.poi.ooxml.POIXMLProperties...org.apache.poi.hwpf.usermodel.Range;
import java.io.*;
/**
* 注:HWPFDocument对应 word的.doc,不支持.docx...,以本地测试时使用的文档为例,输出如下:
0,0,正文
1,0,正文
2,1,标题 1
3,2,标题 2
4,0,正文
5,2,标题 2
6,0,正文
7,2,标题 2
8,0,正文
9,0,正文
10,0