将 Word 转换为文本
为什么我们将 Word 转换为文本?
文本是一种通常包含纯文本或具有最小格式的格式,我们可以从 Word 到 Text 的转换中获得好处:
- 更小的文件大小以节省磁盘空间。
- 与几乎所有应用程序兼容 。
- 没有或有最小格式和/或不寻常的字符。
如何将单词转换为文本?
Spire.Doc是一个 MS Word 组件,它使用户能够直接执行各种 Word 文档处理任务,例如为 .NET 和 Silverlight 生成、读取、编写和修改 Word 文档。它支持将文件从Word Doc 转换为 Text、HTML、PDF、XML、RTF、Docx、Dot 等。
将 Spire.Doc for .NET(或Spire.Office)与 .NET Framework 2.0(或更高版本)一起下载,然后按照下面的简单代码将 Word 转换为 Text。
第 1 步:在 Visual Studio 中创建一个项目。添加 Spire.Doc DLL 作为参考。
第 2 步:使用以下代码加载要转换为 Txt 文件的本地 Word docfile。
Document document = new Document();
document.LoadFromFile(@"D:\Work\Stephen\2011.12.05\Sample.doc");
第 3 步:使用以下代码将 word doc 文件保存为 HTML:
document.SaveToFile("Sample.txt", FileFormat.Txt);
第 4 步:将以下完整代码写入您的项目,然后按 F5 启动它。然后,将自动生成一个 Txt 文件。
[C#]
using System; using System.Windows.Forms; using Spire.Doc; using Spire.Doc.Documents; namespace tohtml_3 { public partial class Form1 : Form { public Form1() { InitializeComponent(); } private void button1_Click(object sender, EventArgs e) { //Create word document Document document = new Document(); document.LoadFromFile(@"D:\Work\Stephen\2011.12.05\Sample.doc"); //Save doc file. document.SaveToFile("Sample.txt", FileFormat.Txt); //Launching the MS Word file. WordDocViewer("Sample.txt"); } private void WordDocViewer(string fileName) { try { System.Diagnostics.Process.Start(fileName); } catch { } } } }
[VB.NET]
Imports System Imports System.Windows.Forms Imports Spire.Doc Imports Spire.Doc.Documents Namespace tohtml_3 Partial Public Class Form1 Inherits Form Public Sub New() InitializeComponent() End Sub Private Sub button1_Click(ByVal sender As Object, ByVal e As EventArgs) 'Create word document Dim document As New Document() document.LoadFromFile("D:\Work\Stephen\2011.12.05\Sample.doc") 'Save doc file. document.SaveToFile("Sample.txt", FileFormat.Txt) 'Launching the MS Word file. WordDocViewer("Sample.txt") End Sub Private Sub WordDocViewer(ByVal fileName As String) Try System.Diagnostics.Process.Start(fileName) Catch End Try End Sub End Class End Namespace
有效截图: