Java如何读取Word批注中的文本和图片

本文将介绍读取Word批注的方法包括读取Word批注中的文本及图片。下面将通过Java代码来演示如何读取批注。

工具使用:Word类库(Free Spire.Doc for Java 免费版)

Jar文件获取:可通过官网下载,下载后解压文件,并将lib文件夹下的Spire.Doc.jar文件导入java程序;也可以通过Maven仓库安装导入。,具体路径配置及导入方法可以参考教程https://www.e-iceblue.cn/licensing/install-spirepdf-for-java-from-maven-repository.html。

(推荐学习:Java视频教程

测试文档如下:批注中包含文本和图片

【示例1】读取批注中的文本

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.Comment;
import com.spire.doc.fields.TextRange;

public class ReadComment {
    public static void main(String[] args) {
        //加载测试文档
        Document doc = new Document();
        doc.loadFromFile(sample.docx);

        //实例化String类型变量
        String text = ;

        //遍历所有批注
        for(int i = 0;i< doc.getComments().getCount();i++){
            Comment comment = doc.getComments().get(i);
            //遍历所有批注中的段落
            for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {
                Paragraph paragraph = comment.getBody().getParagraphs().get(j);
                //遍历段落中的对象
                for (Object object : paragraph.getChildobjects()) {
                    //读取文本
                    if (object instanceof TextRange) {
                        TextRange textRange = (TextRange) object;
                        text = text + textRange.getText();
                    }
                }
            }
        }
        //输入文本内容
        System.out.println(text);
    }
}

批注文本读取结果:

【示例2】读取批注中的图片

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.Comment;
import com.spire.doc.fields.DocPicture;

import javax.imageio.ImageIO;
import java.awt.image.RenderedImage;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;


public class ExtractImgsInComment {
    public static void main(String[] args) throws IOException{
        //加载测试文档
        Document doc = new Document();
        doc.loadFromFile(sample.docx);

        //创建ArrayList数组对象
        ArrayList images = new ArrayList();

        //遍历所有批注
        for(int i = 0;i< doc.getComments().getCount();i++){
            Comment comment = doc.getComments().get(i);
            //遍历所有批注中的段落
            for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {
                Paragraph paragraph = comment.getBody().getParagraphs().get(j);
                //遍历段落中的对象
                for (Object object : paragraph.getChildobjects()) {
                    //获取图片对象
                    if(object instanceof DocPicture){
                        DocPicture picture = (DocPicture) object;
                        images.add(picture.getimage());
                    }
                }
            }
        }
        //提取图片,并指定图片格式
        for (int z = 0; z< images.size(); z++) {
            File file = new File(String.format(图片-%d.png, z));
            ImageIO.write((RenderedImage) images.get(z), PNG, file);
        }
    }
}

批注图片读取结果:

本文来自编程之家网,java教程栏目,欢迎学习!

相关文章

最近看了一下学习资料,感觉进制转换其实还是挺有意思的,尤...
/*HashSet 基本操作 * --set:元素是无序的,存入和取出顺序不...
/*list 基本操作 * * List a=new List(); * 增 * a.add(inde...
/* * 内部类 * */ 1 class OutClass{ 2 //定义外部类的成员变...
集合的操作Iterator、Collection、Set和HashSet关系Iterator...
接口中常量的修饰关键字:public,static,final(常量)函数...