提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|行业资讯|编辑:龚雪|2014-03-28 09:59:06.000|阅读 5691 次
概述:在过去几周,我在业余时间里利用ABBYY开发的FineReader Engine试用版来开发了一些简单的OCR应用程序。本文将分享一下FineReader Engine的一些入门经验。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
关于ABBYYFineReader Engine
ABBYY网站上对FineReaderEngine的描述如下:
ABBYY FineReader Engine是一款功能强大的光学字符识别(OCR)软件开发工具包(SDK),集成了ABBYY最先进的文档识别和转换软件技术,如:光学字符识别(OCR)、智能字符识别(ICR)、光学标记识别(OMR)、条形码识别(OBR)、文档影像和PDF转换。
如果开发人员需要开发具有以下任一功能的应用程序,可以考虑使用ABBYY FineReader Engine软件开发工具包(SDK):
这个SDK中包含有十几个应用程序示例,包括C++、C#、VB.NET、VB、Delphi、Java和几种脚本语言(JavaScript、Perl和VBScript)示例。你可以查看代码开发库(Code Development Library)来快速入门,代码开发库中包含了SDK编程的各个方面。每个截面代码库包含一个或多个代码片段并逐步描述了如何运行一项任务。
选择你需要执行的任务,查看操作步骤描述,查阅源代码示例或运行可执行文件:
安装和设置
在开发机上安装FineReader时有几个步骤。首先,必须安装授权服务器。如果只有1个开发人员使用SDK,此时可以将它直接安装在开发机上。如果多个开发人员要从多个工作站使用FineReader,此时应该将授权服务器安装在所有开发人员都能访问的应用程序服务器上。授权服务器必须安装在物理机器上,而不是虚拟机上。(请注意,该技术可以在虚拟机和云环境中运行)。通过授权管理器,您可以添加和激活您的许可证,无论您的许可证是试用版或购买的正品版本。
接下来,可以将FineReaderEngine安装在开发机上,并连接到授权服务器。
安装完成后,如果您使用的是Visual Studio2010或2012,此时必须再完成几个步骤,才能够使用可视化组件(控件)。这些步骤在其自带的SDK帮助文件“在不同版本的Visual Studio中使用可视化组建”页可以找到。
现在您就可以使用SDK进行开发了。你可以按照上文代码开发库中描述的示例应用程序进行开发或你可以着手创建自己的程序。
创建项目
首先,在C#或Visual Basic中创建1个新的Windows窗体应用程序。我在开发应用程序时使用的是Visual Studio2010。
随后将ABBYY控件添加到Visual Studio工具箱窗口。我在工具箱中创建了1个新的ABBYY 。
将该项目的引用添加到ABBYY \Inc\.Net Interops\ 文件夹下的三个Interop DLL文件中,在安装过程中,这三个文件都已注册并被添加到了GAC里面。
UI控件
下面介绍设计视图Windows窗体中的五个ABBYY控件。
从左上角开始,沿顺时针方向依次是:
文件浏览器-该控件显示了从图像/文件加载的页面清单以及每个页面的处理状态。这些页面可以显示为缩略图或详细信息视图。
图像浏览器 –应用程序用户可以通过该控件来查看和编辑在文件浏览器中选中的页面。
文本编辑器 –用户可以使用文本编辑器查看和编辑FREngine在指定页面中识别出来的文字。
动态浏览器 – 用户可以使用该控件来放大或缩小图像浏览器中选定的区域。
文本校验器 – 用户可以使用该控件来调整扫描和验证过程中未能识别的文本区域。这也是用于文件拼写检查的用户界面。
在这些控件中,将文件和页面同步是非常简单的事情,只需将每个控件添加到代码中的ComponentSynchronizer对象即可:
// Attach components to Synchronizer Synchronizer =new FineReaderVisualComponents.ComponentSynchronizerClass(); Synchronizer.DocumentViewer = (FineReaderVisualComponents.DocumentViewer ) documentViewer.GetOcx(); Synchronizer.ImageViewer = (FineReaderVisualComponents.ImageViewer ) imageViewer.GetOcx(); Synchronizer.ZoomViewer = (FineReaderVisualComponents.ZoomViewer ) zoomViewer.GetOcx(); Synchronizer.TextEditor = (FineReaderVisualComponents.TextEditor ) textEditor.GetOcx();
引擎
下面举个简单的例子,来说明如何运用所有五个FineReader控件来打开窗体并加载PDF文件。
IEngine engine; FRDocument document; ComponentSynchronizer synchronizer; IEngineLoader loader; privatevoid LoadEngine() { loader =new FREngine.InprocLoader(); engine = loader.GetEngineObject("xxxx-xxxx-xxxx-xxxx-xxxx-xxxx"); engine.ParentWindow =this.Handle.ToInt32(); engine.ApplicationTitle =this.Text; document = engine.CreateFRDocumentFromImage((@"C:\Users\ABBYYTest\Images\Documents\DemoSample.pdf"); synchronizer.Document = document; } privatevoid SyncComponents() { synchronizer =new ComponentSynchronizer(); synchronizer.DocumentViewer =(FineReaderVisualComponents.DocumentViewer)DocViewer.GetOcx(); synchronizer.ImageViewer =(FineReaderVisualComponents.ImageViewer)ImgViewer.GetOcx(); synchronizer.TextEditor =(FineReaderVisualComponents.TextEditor)textEdit.GetOcx(); synchronizer.ZoomViewer =(FineReaderVisualComponents.ZoomViewer)zoomView.GetOcx(); synchronizer.TextValidator =(FineReaderVisualComponents.TextValidator)textVal.GetOcx(); } privatevoid UnloadEngine() { // If Engine was loaded, unload it if (engine !=null) { engine =null; } } privatevoid DocumentForm_Load(object sender, EventArgs e) { SyncComponents(); LoadEngine(); } privatevoid DocumentForm_FormClosing(object sender, FormClosingEventArgs e) { UnloadEngine(); }
当然,在实际应用中,您可能会创建一个按钮,用户通过点击这个按钮可以从文件系统中选择需要打开的文件。必须注意的是,卸载引擎非常重要。如果不这样做,就会占用您的工作站所获得的授权,直到手动将它从授权服务器中释放出来为止。我们在进行COM交互操作……资源和内存管理非常重要。
识别
对加载的文件运行识别处理也是一件比较简单的事情。下面是管理该进程的方法:
privatevoid RecognizeDocument() { FREngine.ProcessingParams processingParams =synchronizer.ProcessingParams; FREngine.DIFRDocumentEvents_OnProgressEventHandler progressHandler = newFREngine.DIFRDocumentEvents_OnProgressEventHandler(document_OnProgress); document.OnProgress += progressHandler; document.Process(processingParams.PageProcessingParams, processingParams.SynthesisParamsForPage, processingParams.SynthesisParamsForDocument); document.OnProgress -= progressHandler; }
progressHandler 能够让UI保持响应,并能够让用户启动“取消”命令,以终止某个长时间运行的文档识别进程。
本软件的默认识别语言是英语,如果您需要识别其他语言或任意语言组合的文档,你可以在打开文档前更改RecognizerParams中的SetPredefinedTextLanguage选项,步骤如下:
processingParams.PageProcessingParams.RecognizerParams.SetPredefinedTextLanguage(“ChinesePRC,English”);
导出
要导出某个加载文件,可以调用文档对象的Export()方法。以下代码段将加载的文件导出到RTF文件:
synthesizeIfNeed(); Document.Export(fileName,FREngine.FileExportFormatEnum.FEF_RTF, null);
配置文件
ABBYY FineReader Engine也支持“配置文件”,使引擎能够根据当前使用情况来优化进程。这些配置文件可以使程序自行启动,并自动设置OCR质量的最佳的处理参数。下面是目前可用的配置文件:
可以用Engine.LoadPredefinedProfile来加载这些配置文件。也可以通过.ini格式来创建自定义的用户定义配置文件。该软件自带的帮助文件中有详细说明,可以帮助用户创建自定义的配置文件。可以调用Engine.LoadProfile来加载自定义的用户配置文件。
其他平台和产品
我只使用了FineReaderEngine的Windows SDK,但ABBYY也提供一些其他产品。FineReader Engine还支持Mac OS、Linux、移动SDK平台使用,其中FlexiCapture EngineSDK还能进行数据采集。通过ABBYY托管在Azure的云环境(访问www.ocrsdk.com),开发者还能获得Web API。此外,ABBYY还有某些功能强大的、即装即用的OCR产品和数据采集产品可供用户选择。您可以访问他们的网站,查看他们的全部产品。
后记
ABBYY FineReader Engine软件开发工具包的设置和使用非常简单,有了它,您也可以开发出具有强大OCR功能的应用程序。如果您自己的应用程序需要用到OCR,我强烈建议您试用他们的产品。
本文转载自!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn
文章转载自:慧都控件网通过提供强大的3D CAD数据访问工具并适用于桌面、移动和Web的高级环境3D可视化发动机,HOOPS在提升造船设计和制造流程的效率方面发挥了重要作用。
HOOPS Luminate在汽车行业中的应用具有广泛的潜力和深远的影响。它通过提供高效的3D可视化、虚拟装配与拆解、性能分析、客户定制等功能,帮助汽车制造商在设计、生产和销售过程中提升效率、降低成本并提高产品质量。
在不断发展的软件开发世界中,使工具和框架与最新的平台版本保持同步至关重要,欢迎查阅~
全球航运业对国际贸易至关重要,全球 90% 以上的商品通过海运运输。准确监控和控制这些集装箱的移动对于维持高效的供应链至关重要。手动输入集装箱号码是这一程序的关键部分,它带来了相当大的挑战,例如人为错误和效率低下。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@pclwef.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢