彩票走势图

LEADTOOLS Forms Recognition解决企业表单识别之困

原创|行业资讯|编辑:郝浩|2013-09-05 09:16:24.000|阅读 326 次

概述:本文接下来将讨论处理大量Master forms的一些相关策略,以及如何利用LEADTOOLS Forms Recognition SDK快速、准确地处理表单。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

目前,大多数公司仍然依赖纸质表单来收集客户信息。金融机构、政府机构和医院等大型企业每天的表单堆积如山,但是只要通过良好的规划和合理的设计,表单问题完全可以轻松解决。解决表单问题最行之有效的方式之一就是自动表单识别。自动表单识别渗入到了工作中的方方面面,将用户从大量的纸质表单识别中拯救来,不仅节约时间和金钱,而且提高了识别精度,避免了人工误差。

任何表单识别应用程序中都包含这2种表单:master和filled。Master forms是定义数据提取来源的空白模板。当客户填写并提交表单后,这些表单便与Master forms进行对比,然后提取数据。而filled forms 是企业中最常见最普通的表单。因此,企业在解决表单识别问题的时候,首当其冲的是要解决好Master forms的问题。

本文接下来将讨论处理大量Master forms的一些相关策略,以及如何利用LEADTOOLS Forms Recognition SDK快速、准确地处理表单。

利用多线程提速

如今利用多线程提速已不言而喻。LEADTOOLS Forms Recognition SDK也提供了多线程支持,当初始化AutoFormsEngine时,只需传递IOcrEngine,LEADTOOLS便会自动完成剩下的工作。

// Create an OCR Engine for each processor on the machine. This
// allows for optimal use of thread during recognition and processing.
ocrEngines = new List<IOcrEngine>();
for (int i = 0; i < Environment.ProcessorCount; i++)
{
ocrEngines.Add(OcrEngineManager.CreateEngine(OcrEngineType.Advantage, false));
ocrEngines[i].Startup(formsCodec, null, String.Empty, String.Empty);
}
// Point repository to directory with existing master forms
formsRepository = new DiskMasterFormsRepository(formsCodec, masterFormsFolder);
autoEngine = new AutoFormsEngine(formsRepository, ocrEngines, null, AutoFormsRecognitionManager.Default | AutoFormsRecognitionManager.Ocr, 30, 80, true);

使用条形码分类表单

条形码可能是实现表单分类最直接最快速的方法之一。条形码的最大好处就是,它可以将大量的信息打包到一个狭小的空间,例如QR码便可存储 4,296 个字母数字字符。既然简单的条形码便可识别表单,为何还要使用表单识别?乍一看,使用表单识别似乎有点小题大做了,但是 LEADTOOLS 所提供的先进的表单识别和表单处理技术有更大的好处。如果你打算通过OCR识别表单上的用户信息,你便需要进行一些特殊的步骤来准确地提取信息,如图像清理、页面对齐、校正偏差等。实现这些功能是一项复杂而艰巨的任务,需要编写数千行代码,而 LEADTOOLS SDK中提供了这些图像处理功能。

// Set up the AutoFormsEngine to use Barcodes
autoEngine = new AutoFormsEngine(formsRepository, ocrEngines,
null, AutoFormsRecognitionManager.Barcode, 30, 70, true);

// Run the forms recognition and processing on this document
AutoFormsRunResult runResult = autoEngine.Run(document, null);
if (runResult != null)
{
// Process the recognized form and extract desired info
foreach (FormPage formPage in runResult.FormFields)
{
foreach (FormField field in formPage)
{
// Do something with the extracted field data...
}
}
}

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn

文章转载自:慧都控件网

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP