文档彩票走势图>>Dynamic Web TWAIN使用教程>>扫描识别工具Dynamic Web TWAIN使用教程:OCR(上)
扫描识别工具Dynamic Web TWAIN使用教程:OCR(上)
Dynamic Web TWAIN是一个专为Web应用程序设计的TWAIN扫描识别控件。你只需在TWAIN接口写几行代码,就可以用兼容TWAIN的扫描仪扫描文档或从数码相机/采集卡中获取图像。然后用户可以编辑图像并将图像保存为多种格式, 用户可保存图像到远程数据库或者SharePoint。这个TWAIN控件还支持上传和处理本地图像。
在Web应用程序中快速实现文本识别
介绍
在文档数字化的过程中,经常需要从所获取的图像中提取所需的信息。光学字符识别(OCR)是可以实现此需求的技术。在本文中,我们将探讨如何使用Dynamic Web TWAIN及其OCR加载项在浏览器中快速扫描和识别文本。
请注意:在本文我们只讨论基础的OCR引擎,我们将在客户端使用它。引擎也可以在服务器端使用。
环境
OCR模块本身不依赖于,本文中需要它只是因为使用其包管理器(npm)获取所需文件的速度更快。
步骤
步骤1 创建一个新目录,打开命令行工具(快捷键是Ctrl + Shift +右键单击)。通过npm下载本文中使用的核心控件
npm install dwt@14.2.0
然后,你可以在此目录中看到以下内容
步骤2 打开以下目录
node_modules\dwt\sample
在此你可以看到
步骤3 在本文中,我们将检查OCRADocument.html。双击它打开。如果相关控件尚不可用,请按照提示进行安装
在正常情况下,可以在C:\Windows\SysWOW64\Dynamsoft\DynamsoftService目录中找到已安装的文件。这里的核心文件主要是:
- DynamsoftService.exe
- dwt_trial_14.1.0.0828.dll
- DynamicOCR.dll
- /DynamicOCR/
步骤4 安装完成后,刷新页面,单击Scan Documents(本地需要扫描仪)或Load Images or PDFs以扫描或加载带有英文文本的本地图像文件。然后单击OCR An Image with English。 然后,图像的识别结果将显示在右侧的结果框中
下一篇文章将与大家分享如何实现上述功能,敬请期待~