彩票走势图

LEADTOOLS使用教程:自动识别和处理表格

翻译|使用教程|编辑:莫成敏|2020-04-29 14:11:45.753|阅读 218 次

概述:本文主要介绍通过LEADTOOLS 识别SDK技术,解决在表单扫描过程扫描仪可能产生噪音以及其他的问题。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

LEADTOOLS (Lead Technology)由Moe Daher and Rich Little创建于1990年,其总部设在北卡罗来纳州夏洛特。LEAD的建立是为了使Daher先生在数码图象与压缩技术领域的发明面向市场。在过去超过20多年的发展历程中,LEAD以其在全世界主要国家中占有的市场领导地位,在数码图象开发工具领域中已成为既定的全球领导者。LEADTOOLS开发与发布的LEAD是屡获殊荣的开发工具包。

点击查看LEADTOOLS系列产品

本文主要介绍通过LEADTOOLS 识别SDK技术,可以解决在表单扫描过程扫描仪可能产生噪音以及其他的问题。

LEADTOOLS中包含表单识别和处理SDK技术的产品有,LEADTOOLS Recognition Imaging Developer ToolkitLEADTOOLS Document Imaging Developer Toolkit


处理表格和发票是许多公司日常工作流程的很大一部分。当某人填写表格副本并将其扫描回公司时,则需要提取该信息。许多OCR引擎都在努力提取此信息,因为表单的扫描分辨率可能比原始表单低,扫描仪可能会产生噪音,或者字段可能是非结构化的且动态生成的。值得庆幸的是,LEADTOOLS Forms Recognition SDK可以解决所有这些问题,并且不需要任何其他手动处理。这些先进的表单识别和OCR库由LEAD的专利机器学习算法提供支持,可以处理结构化和非结构化表格,可以帮助公司节省宝贵的时间和金钱。


快速准确的表单识别的主要组件来自两个LEADTOOLS引擎,AutoFormsEngine和和IOcrEngine。AutoFormsEngine提供了高级的表单识别和处理能力,以识别、处理和创建表单,而IOcrEngine是LEADTOOLS提供的所有OCR功能的切入点。

下面的代码显示了运行.NET表单识别和OCR应用程序所需的核心。

// Add these global members
static AutoFormsEngine autoEngine;
static RasterCodecs codecs;
static IOcrEngine ocrEngine;
static DiskMasterFormsRepository formsRepository;

// Initialize the Engines
static void InitFormsEngines()
{
	codecs = new RasterCodecs();

	ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD, false);
	ocrEngine.Startup(codecs, null, null, @"C:\LEADTOOLS 20\Bin\Common\OcrLEADRuntime");

	formsRepository = new DiskMasterFormsRepository(codecs, @"C:\Users\Public\Documents\
	LEADTOOLS Images\Forms\MasterForm Sets\OCR");
	autoEngine = new AutoFormsEngine(formsRepository, ocrEngine, null,
	AutoFormsRecognitionManager.Default | AutoFormsRecognitionManager.Ocr, 30, 80, true);
}

// Recognize and Process a Form
static void RecognizeAndProcessForm()
{
	string resultMessage = "Form not recognized";
	string formToRecognize = @"C:\Users\Public\Documents\LEADTOOLS Images\Forms\Forms to be Recognized\
	OCR\W9_OCR_Filled.tif";

	AutoFormsRunResult runResult = autoEngine.Run(formToRecognize, null);
	if (runResult != null)
	{
	   FormRecognitionResult recognitionResult = runResult.RecognitionResult.Result;
	   resultMessage = $@"This form has been recognized as a
	   {runResult.RecognitionResult.MasterForm.Name} with {recognitionResult.Confidence} confidence.";
	}

	Console.WriteLine("Recognition Results:");
	Console.WriteLine("=========================================================================");
	ShowProcessedResults(runResult);
}

// Print the output of the results
private static void ShowProcessedResults(AutoFormsRunResult runResult)
{
   string resultsMessage = "";

    foreach (FormPage formPage in runResult.FormFields)
        foreach (FormField field in formPage)
            if (field != null)
                resultsMessage = $"{resultsMessage}{field.Name} =
                {(field.Result as TextFormFieldResult).Text}\n";

    Console.WriteLine("Field Processing Results:");
    Console.WriteLine(resultsMessage);
}

如果要自己进行测试,请确保从我们网站直接获得最新的LEADTOOLS SDK安装包,让您免费体验!

相关内容推荐:

LEADTOOLS 使用教程>>>


想要购买LEADTOOLS正版授权,或了解更多产品信息请点击





标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn

文章转载自:

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关产品
LEADTOOLS Imaging Pro Developer Toolkit

20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…

LEADTOOLS Document Suite Developer Toolkit

LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。

LEADTOOLS Document Imaging Developer Toolkit

多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。

LEADTOOLS Medical Developer Toolkit

LEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。

LEADTOOLS Medical Imaging Suite Developer Toolkit

LEADTOOLS Medical Imaging Suite帮您开发功能强大的PACS和医学成像应用程序

扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP