彩票走势图

Word格式处理控件Spire.Doc功能演示:使用Java读取 Word 文本框中的文本/图片/表格

翻译|使用教程|编辑:李显亮|2021-03-10 10:28:57.660|阅读 1139 次

概述:本文介绍使用Spire.Doc for Java来读取Word文本框的方法,读取时,可读取文本框中的文本、图片、表格等。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

Spire.Doc for Java 是一款专业的Java Word组件,开发人员使用它可以轻松地将Word文档创建、读取、编辑、转换和打印等功能集成到自己的Java应用程序中。

 本文介绍使用Spire.Doc for Java来读取Word文本框的方法,读取时,可读取文本框中的文本、图片、表格等。点击此处下载最新版测试。

*这么优秀的国产工具怎能错过呢!在线下单专享“一口价”,查看优惠价格!想要获取更多福利的朋友可以哦~

用于测试的Word源文档如下图:

Word格式处理控件Spire.Doc功能演示:读取 Word 文本框中的文本/图片/表格

读取文本框中的文本

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.TextBox;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;

public class ExtractText {
    public static void main(String[] args) throws IOException {
        //加载含有文本框的Word文档
        Document doc = new Document();
        doc.loadFromFile("test.docx");

        //获取文本框
        TextBox textbox = doc.getTextBoxes().get(0);

        //保存文本框中的文本到指定文件
        File file = new File("ExtractedText.txt");
        if (file.exists())
        {
            file.delete();
        }
        file.createNewFile();
        FileWriter fw = new FileWriter(file, true);
        BufferedWriter bw = new BufferedWriter(fw);

        //遍历文本框中的对象
        for (Object object:textbox.getBody().getChildObjects())
        {
            //判定是否为文本段落
            if(object instanceof Paragraph)
            {
                //获取段落中的文本
                String text = ((Paragraph) object).getText();

                //写入文本到txt文档
                bw.write(text);
            }
        }
        bw.flush();
        bw.close();
        fw.close();
    }
}

文本读取结果:

Word格式处理控件Spire.Doc功能演示:读取 Word 文本框中的文本/图片/表格

读取文本框中的图片

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.DocPicture;
import com.spire.doc.fields.TextBox;
import javax.imageio.ImageIO;
import java.awt.image.RenderedImage;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

public class ExtractImg {
    public static void main(String[] args) throws IOException {
        //加载含有文本框的Word文档
        Document doc = new Document();
        doc.loadFromFile("test.docx");

        //获取文本框
        TextBox textbox = doc.getTextBoxes().get(0);

        //创建List对象
        List images = new ArrayList();

        //遍历文本框中所有段落
        for (int i = 0 ; i < textbox.getBody().getParagraphs().getCount();i++) { Paragraph paragraph = textbox.getBody().getParagraphs().get(i); //遍历段落中的所有子对象 for (int j = 0; j < paragraph.getChildObjects().getCount(); j++) { Object object = paragraph.getChildObjects().get(j); //判定对象是否为图片 if (object instanceof DocPicture) { //获取图片 DocPicture picture = (DocPicture) object; images.add(picture.getImage()); } } } //将图片以PNG文件格式保存 for (int z = 0; z < images.size(); z++) { File file = new File(String.format("图片-%d.png", z)); ImageIO.write((RenderedImage) images.get(z), "PNG", file); } } }

图片读取结果:

Word格式处理控件Spire.Doc功能演示:读取 Word 文本框中的文本/图片/表格



让人兴奋的是整合所有格式API处理套包Spire.office for Java正在慧都网火热销售中!立马1分钟了解全部咨询!

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP