将PDF转换为Word
Spire.PDF for .NET 是一款专门对 Word 文档进行操作的 .NET 类库。致力于在于帮助开发人员轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档,而无需安装 Microsoft Word。
行号用于在每行文本旁边显示 Word 自动计算的行数。当我们需要参考合同或法律文件等文档中的特定行时,它非常有用。word中的行号功能允许我们设置起始值、编号间隔、与文本的距离以及行号的编号方式。使用 Spire.Doc,我们可以实现上述所有功能。本文将介绍如何将文本文件转换为 PDF
欢迎加入spire技术交流群:767755948
在许多情况下,PDF格式是最佳选择,但在需要编辑或修改时,Word更为灵活。PDF文件通常用于在线共享、打印和存档,而Word文档用于创建、编辑和格式化文档。如果您想重新编辑PDF文档,将PDF转换为Word是一个不错的选择。在本文中,您将学习如何使用Spire.PDF for .NET在C#和VB.NET中以编程方式将PDF转换为Word。
- 将PDF转换为固定布局的文档/Docx
- 将PDF转换为灵活结构的Doc/Docx
安装Spire.PDF for .NET
首先,您需要将Spire.PDF for.NET软件包中包含的DLL文件作为引用添加到您的.NET项目中。DLL文件可以从该链接下载或通过NuGet安装。
1 PM> Install-Package Spire.PDF背景知识
Spire.PDF for .NET提供两种转换模式。这两种模式的优缺点如下:
- 固定布局模式:固定布局模式转换速度快,有利于最大程度地保持PDF文件的原貌。但生成文档的可编辑性会受到限制,因为PDF中的每行文本将在生成的Word文档中以单独的框架呈现。
- 流程识别模式:流程识别模式是一种完全识别模式。转换后的内容将不显示在框架中,生成文档的结构是可流动的。生成的Word文档易于重新编辑,但外观可能与原始PDF文件不同。
在C#, VB.NET中将PDF转换为固定布局的Doc/Docx文档
默认情况下,PdfDcoument.SaveToFile()方法将PDF转换为固定布局的Word。以下是详细步骤。
- 创建一个PdfDocument对象。
- 使用PdfDocument.LoadFromFile()方法加载一个PDF文件。
- 使用PdfDocument.SaveToFile(String fileName, FileFormat fileFormat)方法将PDF文档转换为Doc或Docx格式文件。
01 using Spire.Pdf; 02 03 namespace ConvertPdfToFixedLayoutWord 04 { 05 class Program 06 { 07 static void Main(string[] args) 08 { 09 //Create a PdfDocument object 10 PdfDocument doc = new PdfDocument(); 11 12 //Load a PDF document 13 doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf"); 14 15 //Convert PDF to Doc and save it to a specified path 16 doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC); 17 18 //Convert PDF to Docx and save it to a specified path 19 doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX); 20 doc.Close(); 21 } 22 } 23 }
[VB.NET]
01 Imports Spire.Pdf 02 03 Namespace ConvertPdfToFixedLayoutWord 04 Class Program 05 Shared Sub Main(ByVal args() As String) 06 'Create a PdfDocument object 07 Dim doc As PdfDocument = New PdfDocument() 08 09 'Load a PDF document 10 doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf") 11 12 'Convert PDF to Doc and save it to a specified path 13 doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC) 14 15 'Convert PDF to Docx and save it to a specified path 16 doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX) 17 doc.Close() 18 End Sub 19 End Class 20 End Namespace在C#, VB.NET中将PDF转换为灵活结构的文档/Docx
除了默认的转换引擎外,Spire.PDF for .NET还提供了另一种称为Ps模式的引擎,它与流程识别模式配合使用效果更好。要启用Ps转换引擎和流量识别模式,在PdfDocument.ConvertOptions.SetPdfToDocOptions(bool usePsMode, bool useFlowRecognitionMode)方法中传递(true, true)作为参数。整个步骤如下。
- 创建一个PdfDocument对象。
- 使用PdfDocument.loadFromFile()方法加载一个PDF文件。
- 使用PdfDocument.ConvertOptions.SetPdfToDocOptions(true,true)方法启用Ps转换引擎和流式识别模式。
- 使用PdfDocument.SaveToFile()方法将PDF文档转换为Doc或Docx格式文件。
01 using Spire.Pdf; 02 03 namespace ConvertPdfToFlexibleLayoutWord 04 { 05 class Program 06 { 07 static void Main(string[] args) 08 { 09 //Create a PdfDocument object 10 PdfDocument doc = new PdfDocument(); 11 12 //Load a PDF document 13 doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf"); 14 15 //Specify the PDF to Word conversion options 16 doc.ConvertOptions.SetPdfToDocOptions(true, true); 17 18 //Convert PDF to Doc 19 doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC); 20 21 //Convert PDF to Docx 22 doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX); 23 doc.Close(); 24 } 25 } 26 }
01 Imports Spire.Pdf 02 03 Namespace ConvertPdfToFlexibleLayoutWord 04 Class Program 05 Shared Sub Main(ByVal args() As String) 06 'Create a PdfDocument object 07 Dim doc As PdfDocument = New PdfDocument() 08 09 'Load a PDF document 10 doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf") 11 12 'Specify the PDF to Word conversion options 13 doc.ConvertOptions.SetPdfToDocOptions(True, True) 14 15 'Convert PDF to Doc 16 doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC) 17 18 'Convert PDF to Docx 19 doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX) 20 doc.Close() 21 End Sub 22 End Class 23 End Namespace
申请临时许可证
如果您想从生成的文档中删除评估信息,或解除功能限制,请申请一个30天的试用许可证。