提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:莫成敏|2020-06-09 15:46:43.447|阅读 423 次
概述:借助LEAD强大的OCR库,开发人员能够轻松制作自动化的OCR解决方案,并仅用五行代码即可将这些图像转换为可搜索的PDF转换。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
如今,在每个地方,几乎每个人都在使用PDF。在大多数组织中,PDF文档对于业务应用程序和工作流程至关重要。由于文件格式的可移植性和多功能性,许多行业,例如保险代理机构、金融机构和法律实践,已将其文档管理系统标准化为PDF格式。
这些PDF的使用方式取决于所处理PDF的类型。PDF有两种主要类型:图像和可搜索。例如,如果您使用文字处理器保存PDF,则很可能是可搜索的PDF,您可以根据需要复制/粘贴文档中的文本。另一方面,如果您使用扫描仪将纸张转换为PDF,则很可能是图像PDF,并且您将无法搜索文本。
即使您使用扫描仪来创建图像PDF或由其他人发送了图像PDF,仍然可以通过某种方式使它可搜索。这是通过OCR发生的,OCD是LEADTOOLS最擅长的!借助LEAD强大的OCR库,开发人员能够轻松制作自动化的OCR解决方案,并仅用五行代码即可将这些图像转换为可搜索的PDF转换。这些解决方案可以节省人员和公司两个最宝贵的资源:时间和金钱。
LEAD强大的OCR库包括这些产品:LEADTOOLS Recognition Imaging Developer Toolkit、LEADTOOLS Document Imaging Suite、LEADTOOLS OCR Module - LEAD Engine、LEADTOOLS OCR Module - OmniPage Engine、LEADTOOLS ICR Module - OmniPage Engine。
以下代码向您展示了创建将图像转换为可搜索的PDF的解决方案所需的全部内容。如果您需要完整的分步教程,请查看我们的“使用OCR将图像转换为可搜索PDF教程”。(如文章后面内容)
static void OCR(string inputFile, string outputFile) { using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD, false)) { //Startup the LEADTOOLS OCR Engine ocrEngine.Startup(null, null, null, null); //Run the AutoRecognizeManager and specify PDF format ocrEngine.AutoRecognizeManager.Run(inputFile, outputFile, DocumentFormat.Pdf, null, null); Console.WriteLine($"OCR output saved to {outputFile}"); } }
使用OCR将图像转换为可搜索的PDF-控制台C#
本教程说明如何创建一个C#Windows控制台应用程序,该应用程序设置LEAD OCR引擎以处理OCR。
创建项目并添加LEADTOOLS参考
在Visual Studio中,创建一个新的C#Windows Console项目,并添加以下必要的LEADTOOLS引用。
所需的参考取决于项目的目的。引用可以通过以下两种方法中的一种或另一种添加(但不能同时添加)。对于此项目,需要以下参考:
如果使用NuGet引用,则本教程需要以下NuGet软件包:
如果使用本地DLL引用,则需要以下DLL:
本地DLL安装在<INSTALL_DIR>\LEADTOOLS 20\Bin\Dotnet4\x64:
设置许可证文件
许可证可解锁项目所需的功能。必须在调用任何工具包功能之前进行设置。
有两种类型的运行时许可证:
添加OCR代码
创建项目,添加参考和许可证集后,即可开始编码。
在解决方案资源管理器中,打开Program.cs。要初始化和运行OCR引擎,请添加一个新OCR(string inputFile, string outputFile)方法并在Main方法内部调用它。
将以下语句添加到Program.cs顶部的using块中:
C#
// Using block at the top using System; using Leadtools; using Leadtools.Document.Writer; using Leadtools.Ocr;
C#
static void OCR(string inputFile, string outputFile) { using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD, false)) { //Startup the LEADTOOLS OCR Engine ocrEngine.Startup(null, null, null, null); //Run the AutoRecognizeManager and specify PDF format ocrEngine.AutoRecognizeManager.Run(inputFile, outputFile, DocumentFormat.Pdf, null, null); Console.WriteLine($"OCR output saved to {outputFile}"); } }
C#
static void Main(string[] args) { SetLicense(); string input = @"C:\Users\Public\Documents\LEADTOOLS Images\OCR1.TIF"; string output = @"C:\Users\Public\Documents\LEADTOOLS Images\OCR1.PDF"; OCR(input, output); }
运行项目
按F5或选择Debug- > Start Debugging运行项目。
如果正确执行了这些步骤,则会出现控制台并确认许可证设置正确,然后应用程序将OCR1.TIF图像转换为PDF格式,并将其保存到指定位置(作为可搜索的PDF)。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn
文章转载自:LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。
本文探讨 SQL Server 中 NULL 和空值之间的区别,并讨论如何有效地处理它们。
Unity 是一款功能极其丰富的游戏引擎,允许开发人员将各种媒体集成到他们的项目中。但是,它缺少最令人兴奋的功能之一 - 将 Web 内容(例如 HTML、CSS 和 JavaScript)直接渲染到 3D 场景中的纹理上的能力。在本文中,我们将介绍如何使用 DotNetBrowser 在 Unity3D 中将 Web 内容渲染为纹理。
DevExpress v24.2帮助文档正式发布上线了,请按版本按需下载~
本教程将向您展示如何用MyEclipse构建一个Web项目,欢迎下载最新版IDE体验!
20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…
LEADTOOLS Document Suite Developer ToolkitLEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Document Imaging Developer Toolkit多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。
LEADTOOLS Medical Developer ToolkitLEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。
LEADTOOLS Medical Imaging Suite Developer ToolkitLEADTOOLS Medical Imaging Suite帮您开发功能强大的PACS和医学成像应用程序
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@pclwef.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢