LEADTOOLS使用教程:表单识别SDK帮您处理数据表单
LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,它用于在企业级文档自动解决方案中建立端到端的文档图像应用程序,而这些文档图像应用程序需要有捕捉,表格识别和处理,存档,注释和显示功能。这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
新的一年,公司每天都会收到纸质表格来收集客户的信息。但是这些公司如何识别这些数据,还是他们自己手动输入数据呢?假设您正在处理发票,您每天收到几百张。当计算机可以在几秒钟内为您完成所有操作时,无需浪费时间输入不同的名称和数字。
LEADTOOLS表格识别和处理SDK为您提供20/20的计算机视觉,从纸质表格将数据传输到你的系统,您可以节省时间和金钱。用户友好的SDK使开发人员可以在最短的时间内创建应用程序,而不必经历开源代码的麻烦。表单具有各种形状、大小和用途,并且LEADTOOLS具有处理所有表单的工具。除了具有静态字段位置的基本表单识别功能外,LEADTOOLS还能够检测和处理非结构化和结构松散的文档,例如发票、驾照、名片和护照。
使用表单识别时,您只会处理两种表单,即主表单和填充表单。主表单是用作模板的空白表单,您可以在其中指定要提取的数据。提交填写好的表格后,会将这些表格与主表格进行比较,并提取数据。您可能会想,“好吧,如果我有成千上万的文档需要处理怎么办?这可能需要一整天。”,LEADTOOLS为其提供了多线程支持。
编码!
此代码段演示了如何使用Forms Recognition SDK识别已填写的表单。
// Set the name of the folder that contains the Master Forms string root = @"C:\Users\Public\Documents\LEADTOOLS Images\Forms\MasterForm Sets"; using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD, false)) { ocrEngine.Startup(null, null, null, null); DiskMasterFormsRepository repo = new DiskMasterFormsRepository(ocrEngine.RasterCodecsInstance, root); BarcodeEngine barcodeEngine = new BarcodeEngine(); using (AutoFormsEngine autoEngine = new AutoFormsEngine(repo, ocrEngine, barcodeEngine, AutoFormsRecognitionManager.Ocr | AutoFormsRecognitionManager.Default, 30, 80, false)) { string[] files = Directory.GetFiles (@"C:\Users\Public\Documents\LEADTOOLS Images\Forms\Forms to be Recognized\OCR", "*.tif"); ProcessFiles(autoEngine, files); } } // The following code shows how to handle the AutoFormsEngine class in a multi-threaded application private static void ProcessFiles(AutoFormsEngine autoEngine, string[] files) { Console.WriteLine("Started Processing Files ..."); Parallel.ForEach(files, file => { AutoFormsRunResult result = autoEngine.Run(file, null); if (result != null) { if (result.FormFields != null && result.RecognitionResult.MasterForm != null) Console.WriteLine(string.Format(" Master Form Found \"{0}\" for {1}", result.RecognitionResult.MasterForm.Name, file)); else Console.WriteLine(string.Format(" No Master Form Found for {0}", file)); } }); }
LEADTOOLS表单识别和处理SDK是同类产品中最灵活,功能最强大的产品。LEADTOOLS凭借其全面的栅格、文档、医学和多媒体成像工具套件系列,提供了令人难以置信的价值。
本文内容到这里就结束了,希望对您有所帮助~感兴趣的朋友可以继续关注我们网站哦,了解更多产品资讯~
相关内容推荐: