彩票走势图

GroupDocs.Parser授权购买
下载:103 收藏:0

GroupDocs.Parser (产品编号:14120)

构建可从多种文档格式中提取文本和元数据的.NET和Java应用程序。

标签:文档管理GroupDocs

开发商: GroupDocs

当前版本: v19.11

产品类型:控件

产品功能:文档管理

平台语言:

开源水平:不提供源码

本产品的分类与介绍仅供参考,具体以商家网站介绍为准,如有疑问请来电 023-68661681 咨询。

GroupDocs.Parser for .NET是一个文本提取器API,可从.NET应用程序中提取文档,电子表格,演示文稿,电子邮件和档案中的原始或格式化文本和元数据。

* 关于本产品的分类与介绍仅供参考,精准产品资料以官网介绍为准,如需购买请先行测试。

GroupDocs.Parser产品系列

groupdocs-Parser-net  
GroupDocs.Parser for.NET

适用于Windows Forms,ASP.NET,WPF,WCF和其他基于.NET Framework的应用程序的原生.NET API

groupdocs-Parser-java  
GroupDocs.Parser forJava

用于桌面,Web和其他基于Java SE或EE的应用程序的原生Java API

GroupDocs.Parser for .NET

GroupDocs.Parser for .NET是一个文本提取器API,用于使用C#,ASP.NET和其他.NET技术开发的业务应用程序。它支持从支持格式的文件中提取原始,格式化和结构化文本以及元数据。通过GroupDocs.Parser for .NET,你的应用程序还可以对流行格式(如电子表格,演示文稿,PDF,ZIP存档等)执行受密码保护的文档解析。

总体特性

以下是GroupDocs.Parser for .NET的概述:

总体特性


支持的文件格式

GroupDocs.Parser for .NET支持以下文件格式:

支持的文件格式


平台独立

GroupDocs.Parser for .NET支持以下操作系统,框架和包管理器:

平台独立


GroupDocs.Parser for .NET功能

  • 统计计算单个或多个文件中的Word出现次数

  • 检测受密码保护的XML文档的媒体类型并从中提取文本

  • 从简单PDF文件或PDF包文档中取出文本

  • 从Excel电子表格中收集单元格,行和列中的原始文本或格式化文本

  • 从EPUB,CHM,Markdown和FB2文件中拉出单句或全文

  • 从分析文档中获取文本区域并从支持的文档格式中提取元数据

  • 从电子邮件容器中获取数据(Exchange Web服务器,POP3,IMAP)

  • 使用纯文本格式化程序(简单和ASCII)或使用Markdown Formatter获取文本

  • 从文件或流中提取文本内容而无需安装文档阅读器

  • 以编程方式从电子邮件和附件中获取格式化文本

  • 从PDF表单中提取数据并从PDF或Word文档中获取格式化表

  • 从Word文档中提取原始或HTML格式的文本

  • 摘录EPUB和CHM文件中的目录

  • 从支持的格式获取所有或选定的图像并旋转提取的图像

  • 在文档中搜索简单文本,单词和正则表达式

  • Markdown Formatter支持字体,超链接,标题,列表和表格的格式

  • 使用快速或标准文本提取模式从文档中获取格式化文本

  • 从OneNote文档的单页或多页中抽出文本

  • 从PowerPoint演示文稿中获取格式化文本或从特定幻灯片中删除文本

  • HTML格式化程序支持段落,超链接,字体,标题,列表和表格的格式

  • 拉出文本及其内容结构完整和摘录文档中突出显示的文本

  • 从Zip Archives和OST容器中的文件中取出文本并从数据库容器中提取文本

  • 在文档中搜索和提取突出显示的表达式

  • 使用边,角度和交点执行自定义格式以格式化纯文本


从文档中提取文本

使用GroupDocs.Parser for .NET API从文档中提取文本很简单,只需几行代码即可实现。

提取文本代码

更新时间:2019-01-15 16:11:08.000 | 录入时间:2019-01-15 16:08:46.000 | 责任编辑:胡涛

实时了解产品最新动态与应用

扫码联系 获取帮助

相关产品
Aspose.Word for Python

允许开发人员在不需要Office Automation的情况下处理Word文档的API

Add-in Express for Office and .NET

开发商业类微软Office扩展的一体化框架,如Office COM Add-in、Outlook插件

3-Heights PDF Optimization

PDF优化类库,用于压缩PDF文件的尺寸大小、提高网络浏览速度、提供高质量的打印等

PDF Studio

PDF Studio是一款功能强大的,易于使用的PDF编辑器,它以Adobe® Acrobat®和其他PDF工具的小部分代价在PDF文档上提供了大量的功能。

Spire.Cloud

Spire.Cloud是一款帮助WEB网站或WEB应用系统轻松处理Office文件全面的解决方案。

扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP