.NET Word 文档如何转换为 XML 文件

XML 是一种主要用于储存和传输数据的标记语言。 XML 与 HTML 相似,都是标记语言,但也有很多不同之处。 HTML 主要用于在浏览器中展示网页内容,而XML 文件则可以用于储存和传输任意数据。 XML 具有简洁、普遍、易用等特点,使用广泛,尤其是在网络服务器中。如果要将Word文档作为 XML 文件进行储存或传输,可以将 Word 文档转换为 XML 文件。本文将展示将 Word 文档转换为 XML 文件的具体操作。

引入DLL

一、 通过NuGet安装

右键单击解决方案中的依赖项,找到“管理NuGet包”,在其中搜索“FreeSpire.Doc”并添加到引用项中。
复制以下内容到控制台安装
PM> Install-Package FreeSpire.Doc

二、 手动添加DLL

在FreeSpire.Doc for .NET官网下载免费版后解压,在解决方案中找到依赖项,右键单击找到添加引用项,找到Spire.Doc.dll并添加到引用项中。

转换操作步骤

  • 用Spire.Doc转换 Word 文档为 XML 文档的操作十分简单,主要步骤如下:
  • 为 Document 类创建对象。
  • 利用 Document.LoadFromFile() 方法加载 Word 文档。
  • 利用 Document.SaveToFile() 方法将 Word 文档转换为 XML 文件并保存。

C# 代码

using System;
using Spire.Doc;
using Spire.Doc.Documents;

namespace ConvertHTMLtoWord
{
    internal class Program
    {
        static void Main(string[] args)
        {
            //创建 Document 对象
            Document document = new Document();

            //从磁盘加载 HTML 文件
            document.LoadFromFile(@"D:\testp\示例.html");
            

            //将 HTML 文件转为 Word 并保存
            String result = "HtmltoWord.docx";
            document.SaveToFile(result, FileFormat.Html);
        }
    }
}

VB.NET 代码

Imports System
Imports Spire.Doc
Imports Spire.Doc.Documents

Module Program
    Sub Main(args As String())
        '创建 Document 对象
        Dim document As New Document()

        '从磁盘加载 HTML 文件
        document.LoadFromFile("D:\testp\示例.html")

        '将 HTML 文件转为 Word 并保存
        Dim result As String = "Html转Word.docx"
        document.SaveToFile(result, FileFormat.Docx2013)
    End Sub
End Module

转换效果:

以上代码中引入的是免费Word库Free Spire.Doc for .NET版本中的dll。

相关文章

php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念