提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:胡涛|2022-07-18 10:21:34.867|阅读 114 次
概述:本指南将提供一种在 C# 和 VB.NET 中提取 Word 文本的便捷解决方案,欢迎查阅!
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
Word 文本可以从文档中提取并保存在其他文件(例如 TXT 文件)中以供其他用途。本指南将提供一种在 C# 和 VB.NET 中提取 Word 文本的便捷解决方案。
一般来说,一个Word文档必须包含很多内容,比如文本、图片、表格等,其中一些内容可以提取出来用于其他文档或文件中。以下指南重点介绍如何通过 Spire.Doc for .NET 从 Word 文档中提取文本并保存在 C# 和 VB.NET 中的 TXT 文件中。以下屏幕截图显示了从 Word 中提取的部分文本。
文本全部保存在 .NET 提供的 Section 类 Spire.Doc 的 Paragraph 中。因此,您必须先获取文档的部分和段落,然后再获取要提取的文本。以下步骤介绍了有关如何提取文本的详细信息。
首先,使用参数字符串fileName调用Document类的LoadFromFile方法来加载文档。其次,初始化一个 StringBuilder 类实例来保存接下来要提取的文本。第三,使用 foreach 语句获取文档中每个部分的每个段落,并调用StringBuilder 类的AppendLine(Paragraph.Text)方法将所有提取的字符串(所有段落中的文本)的副本附加到 StringBuilder 实例中。最后,使用参数字符串路径、字符串内容调用 File.WriteAllText 方法来创建一个新文件以保存提取的文本。请使用代码。
using Spire.Doc; using Spire.Doc.Documents; using System.Text; using System.IO; namespace ExtractTextfromWord { class ExtractText { static void Main(string[] args) { //Load Document Document document = new Document(); document.LoadFromFile(@"E:\Work\Documents\WordDocuments\Spire.Doc for .NET.docx"); //Initialzie StringBuilder Instance StringBuilder sb = new StringBuilder(); //Extract Text from Word and Save to StringBuilder Instance foreach (Section section in document.Sections) { foreach (Paragraph paragraph in section.Paragraphs) { sb.AppendLine(paragraph.Text); } } //Create a New TXT File to Save Extracted Text File.WriteAllText("Extract.txt", sb.ToString()); System.Diagnostics.Process.Start("ExtractText.txt"); } } }
[VB]
Imports Spire.Doc Imports Spire.Doc.Documents Imports System.Text Imports System.IO Namespace ExtractTextfromWord Friend Class ExtractText Shared Sub Main(ByVal args() As String) 'Load Document Dim document As New Document() document.LoadFromFile("E:\Work\Documents\WordDocuments\Spire.Doc for .NET.docx") 'Initialzie StringBuilder Instance Dim sb As New StringBuilder() 'Extract Text from Word and Save to StringBuilder Instance For Each section As Section In document.Sections For Each paragraph As Paragraph In section.Paragraphs sb.AppendLine(paragraph.Text) Next paragraph Next section 'Create a New TXT File to Save Extracted Text File.WriteAllText("Extract.txt", sb.ToString()) System.Diagnostics.Process.Start("ExtractText.txt") End Sub End Class End Namespace
Spire.Doc 是无需自动化即可操作 MS Word 文档的专业独立组件,使开发人员能够在其 .NET、WPF 和 Silverlight 应用程序上生成、读取、写入、修改 Word 文档。
欢迎下载|体验更多E-iceblue产品
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn
本文探讨 SQL Server 中 NULL 和空值之间的区别,并讨论如何有效地处理它们。
Unity 是一款功能极其丰富的游戏引擎,允许开发人员将各种媒体集成到他们的项目中。但是,它缺少最令人兴奋的功能之一 - 将 Web 内容(例如 HTML、CSS 和 JavaScript)直接渲染到 3D 场景中的纹理上的能力。在本文中,我们将介绍如何使用 DotNetBrowser 在 Unity3D 中将 Web 内容渲染为纹理。
DevExpress v24.2帮助文档正式发布上线了,请按版本按需下载~
本教程将向您展示如何用MyEclipse构建一个Web项目,欢迎下载最新版IDE体验!
无需Microsoft Word也可在任何平台上满足Word文档的一切操作需求。
Aspose.PDF for .NETPDF文档创建组件,无需Adobe Acrobat,也可以在任何平台上操作PDF文档。
Aspose.Cells for .NET专业的电子表格控件,无需MS Excel也可满足一切Excel表格功能。
Spire.Office for .NET专业的.NET Office套件,涵盖office文档创建、编辑、转换、管理和OCR内容识别等操作
Spire.Doc for .NETSpire.Doc for .NET 是一款专门对 Word 文档进行操作的 .NET 类库。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@pclwef.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢