文档彩票走势图>>E-iceblue中文文档>>将 HTML 转换为 XML
将 HTML 转换为 XML
Office Open 成为在 Web 上交付结构化数据的首选技术,与 HTML 携手并进并完全补充 HTML。因此,我们需要在工作的某个时间点将 HTML 转换为 Office OpenXML。本文主要通过一个专业的Word .NET 库Spire.Doc来讲述转换过程。
这篇文章仍然专注于将word从/到HTML,而主要是关于在word文档和HTML中嵌入图像的支持。随着Spire.Doc的改进(从Spire.Doc V. 4.9.32开始),现在它支持ImageEmbedded的新功能。
首先我们需要完成程序前的准备工作:
- 下载 Spire.Doc并将其安装在您的机器上。
- 添加 Spire.Doc.dll 文件作为参考。
- 打开bin文件夹,选择.NET 4.0下的三个dll文件。
- 右键单击属性并在其菜单中选择属性。
- 将目标框架设置为 .NET 4。
-
添加 Spire.Doc 作为命名空间。
以下步骤将向您展示如何轻松做到这一点:
第 1 步:创建一个 Word 文档。[C#]
Document doc = new Document();
第 2 步:加载 HTML 文件。
[C#]
doc.LoadFromFile("Sample.html");
第 3 步:将 HTML 保存为 XML 文件。
[C#]
doc.SaveToFile("test.xml", FileFormat.Xml);
这是完整的 C# 和 VB.NET 代码
[C#]
using Spire.Doc; namespace HTMLXML { class Program { static void Main(string[] args) { Document doc = new Document(); doc.LoadFromFile("Sample.html"); doc.SaveToFile("test.xml", FileFormat.Xml); } } }
[VB.NET]
Imports Spire.Doc Namespace HTMLXML Class Program Private Shared Sub Main(args As String()) Dim doc As New Document() doc.LoadFromFile("Sample.html") doc.SaveToFile("test.xml", FileFormat.Xml) End Sub End Class End Namespace
原始 HTML 文件的预览。
生成的 Office OpenXML 文件的预览。