彩票走势图

LEADTOOLS 入门教程: 自动识别和处理表单 - C# .NET Core

翻译|使用教程|编辑:胡涛|2022-10-20 09:57:29.703|阅读 101 次

概述:本文主要介绍如何使用leadtools自动识别和处理表单,欢迎查阅~

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

LEADTOOLS 是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。

LEADTOOLS 最新下载

本教程展示了如何LEADDocument使用 LEADTOOLS SDK 在 C# .NET Core 应用程序中向 a 添加页面和从中删除页面。

概括 AutoFormsEngine本教程介绍如何使用C# .NET Core 控制台应用程序中的高级类识别和处理表单。
完成时间 30分钟
视觉工作室项目
平台 C# .NET Core 控制台应用程序
IDE 视觉工作室 2019、2022
开发许可证 下载 LEADTOOLS

在学习从 LEADDocument中添加和删除页面 - C# .NET Core 教程之前,通过查看添加引用和设置许可教程来熟悉创建项目的基本步骤。

创建项目并添加 LEADTOOLS 参考

从添加引用和设置许可证教程中创建的项目的副本开始。如果您没有该项目,请按照该教程中的步骤创建它。

所需的参考资料取决于项目的目的。可以通过 NuGet 包添加引用。

本教程需要以下 NuGet 包:

  • Leadtools.Document.Sdk

有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅您的应用程序中包含的文件。

设置许可文件

许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。

有两种类型的运行时许可证:

  • 评估许可证,在下载评估工具包时获得。它允许评估工具包。
  • 部署许可证。如果需要部署许可证文件和开发人员密钥,请参阅获取许可证。
初始化 AutoFormsEngine、RasterCodes、IOcrEngine 和 DiskMasterFormsRepository

创建项目、添加参考和许可证集后,就可以开始编码了。

在解决方案资源管理器中,打开Program.cs. 将以下语句添加using到Program.cs.

【C#】

using System;
using System.IO;
using Leadtools;
using Leadtools.Codecs;
using Leadtools.Document;
using Leadtools.Forms.Auto;
using Leadtools.Forms.Processing;
using Leadtools.Forms.Recognition;
using Leadtools.Ocr;

将以下全局变量添加到Program类中。

【C#】

static AutoFormsEngine autoEngine;
static RasterCodecs codecs;
static IOcrEngine ocrEngine;
static DiskMasterFormsRepository formsRepository;

Program向名为的类添加一个新方法InitFormsEngines()。调用set license调用下面的InitFormsEngines()方法里面的Main()方法,如下图。

【C#】

static void Main(string[] args)
{
if (!SetLicense())
Console.WriteLine("Error setting license");
else
Console.WriteLine("License file set successfully");

InitFormsEngines();
}

将以下代码添加到InitFormsEngines()方法中以初始化AutoFormsEngine、RasterCodecs、IOcrEngine和DiskMasterFormsRepository对象。

static void InitFormsEngines()
{
codecs = new RasterCodecs();

ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD);
ocrEngine.Startup(codecs, null, null, @"C:\LEADTOOLS22\Bin\Common\OcrLEADRuntime");

formsRepository = new DiskMasterFormsRepository(codecs, @"C:\LEADTOOLS22\Resources\Images\Forms\MasterForm Sets\OCR");
autoEngine = new AutoFormsEngine(formsRepository, ocrEngine, null, AutoFormsRecognitionManager.Default | AutoFormsRecognitionManager.Ocr, 30, 80, true);

Console.WriteLine("Engines initialized successfully!");
}
添加表单识别和处理代码

在Program类中添加两个名为RecognizeAndProcessForm()和的新方法ShowProcessedResults(AutoFormsRunResult runResult)。在方法之后调用RecognizeAndProcessForm()方法内部的方法,如下一节所示。在方法的底部调用方法,作为重载传递,如下所示。MainInitFormsEngines()ShowProcessedResults()runResultRecognizeAndProcessForm()

将以下代码添加到RecognizeAndProcessForm()方法中,以根据主表单识别给定表单并处理表单以提取所需信息。

static void RecognizeAndProcessForm()
{
try
{
string resultMessage = "Form not recognized";
string formToRecognize = @"C:\LEADTOOLS22\Resources\Images\Forms\Forms to be Recognized\OCR\W9_OCR_Filled.tif";

AutoFormsRunResult runResult = autoEngine.Run(formToRecognize, null);
if (runResult != null)
{
FormRecognitionResult recognitionResult = runResult.RecognitionResult.Result;
resultMessage = $@"This form has been recognized as a {runResult.RecognitionResult.MasterForm.Name} with {recognitionResult.Confidence}% confidence.";
}

Console.WriteLine("Recognition Results:");
Console.WriteLine(resultMessage);
Console.WriteLine("=========================================================================");
ShowProcessedResults(runResult);
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}
}

将以下代码添加到ShowProcessedResults()方法中,以将方法的处理结果显示RecognizeAndProcessForm()到控制台。

// Output Processed Results
private static void ShowProcessedResults(AutoFormsRunResult runResult)
{
if (runResult == null)
return;

string resultsMessage = "";
try
{
foreach (FormPage formPage in runResult.FormFields)
foreach (FormField field in formPage)
if (field != null)
resultsMessage = $"{resultsMessage}{field.Name} = {(field.Result as TextFormFieldResult).Text}\n";
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}

if (string.IsNullOrEmpty(resultsMessage))
{
Console.WriteLine("Field Processing Results");
Console.WriteLine("No fields were processed");
Console.WriteLine("Press any key to exit . . .");
Console.ReadKey(true);
}
else
{
Console.WriteLine("Field Processing Results:");
Console.WriteLine(resultsMessage);
Console.WriteLine("Press any key to exit . . .");
Console.ReadKey(true);
}
}

 LEADTOOLS SDK 随附并安装的是样本主表单集和样本填写表单,用于识别和处理。本教程使用这些示例。示例文件安装在<INSTALL_DIR>\LEADTOOLS22\Resources\Images\Forms.

关闭 OCR 引擎
static void Main(string[] args)
{
if (!SetLicense())
Console.WriteLine("Error setting license");
else
Console.WriteLine("License file set successfully");
InitFormsEngines();
RecognizeAndProcessForm();

autoEngine.Dispose();
if (ocrEngine != null && ocrEngine.IsStarted)
ocrEngine.Shutdown();
}
处理流

如果您想使用内存流加载表单,请在下面的RecognizeAndProcessForm()方法中添加以下代码string formToRecognize = @"C:\LEADTOOLS22\Resources\Images\Forms\Forms to be Recognized\OCR\W9_OCR_Filled.tif";:

【C#】

using (var stream = File.OpenRead(formToRecognize))
{
var options = new LoadDocumentOptions();
using (var document = DocumentFactory.LoadFromStream(stream, options))
{
// Console commands to double check that the document was loaded properly
Console.WriteLine(document.DocumentId);
Console.WriteLine("Document loaded");
}
}

F5或选择Debug -> Start Debugging运行项目。

如果正确执行了这些步骤,则会出现控制台并显示以下数据结果:

  1. 公认的形式和置信度值(例如,置信度为 98% 的 W9。)
  2. 处理后的填写数据(例如,公司名称、地址等)

控制台显示已识别的表格和已填写表格的处理结果。

在此示例中,使用了 W-9 表格。它被正确识别,置信度为 98%(其中 0 表示没有置信度,100% 表示完全置信度)。

以上便自动识别和处理表单 - C# .NET Core ,如果您还有其他疑问,欢迎咨询我们或者加入我们官方技术交流群。


欢迎下载|体验更多LEADTOOL产品

您还可以加入产品技术交流Q群:731259648


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关产品
LEADTOOLS Imaging SDK

LEADTOOLS Imaging Pro Developer Toolkit

20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…

LEADTOOLS Document Suite Developer Toolkit

LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。

LEADTOOLS Document Imaging Developer Toolkit

多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。

扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP