我正在研究 OKAPI,我必须在现有代码中添加分页功能。
目前无法单独使用 Okapi。 Okapi 过滤器不遗余力地避免干扰文档的结构,并且目前没有在提取或合并期间添加新标记的功能。
您最好的办法可能是将您的方法与旨在修改文档的 Apache POI 之类的东西结合起来。您可以先使用 POI 重新格式化,然后使用 Okapi 提取。