PDF-XChange Editor使用教程:如何对文档执行OCR?
PDF-XChange Editor能替代Adobe Reader功能,比任何其他免费的PDF阅读器、查看器和编辑器更小,但功能更加丰富,支持用户在评价模式尝试使用PDF-Xchange免费提供的扩展功能。
OCR
OCR(光学字符识别)会扫描基于图像的文档,识别文本,然后在文本上插入不可见的文本层。文本层包含与文档中识别的文本相同的文本,这意味着可以通过不可见的文本层有效地搜索和选择文档中基于图像的原始文本,这是OCR的主要优势。但是,应注意,文档文本无法以与普通的基于文本的文档相同的方式进行编辑-尽管它是不可见的文本层,但它仍然是基于图像的文档。
请按照以下步骤执行OCR:
单击功能区工具栏中的Convert,然后单击子菜单中的OCR页面。将打开OCR页面对话框:
页面范围选项如下:
选择All即所有页面应用为OCR文档。
选择Current Page仅对当前页面进行OCR。
使用Pages确定在其上执行OCR处理的文档的特定页面。页面范围设置在下文详细说明。
使用Subset选项选择所有页面,仅奇数页或仅偶数页。
识别选项确定OCR流程的语言和准确性。如果所需的语言在下拉菜单中不可用,请单击More Languages以获取更多选项。提高精度会增加过程花费的时间,反之亦然。此外,应注意,如果执行操作的文档具有瑕疵,则将精度设置为较高可能会导致输出异常。这是因为该软件将搜索到更大的深度,并且可能尝试将瑕疵识别为文本。
输出选项确定OCR流程中输出信息的格式。选择创建新的可搜索PDF或保留原始内容并根据需要添加文本层。
创建新的可搜索PDF将复制当前文件并创建一个新的PDF,在其中执行OCR过程。如果您希望使当前文件不受该过程的影响,但是想测试结果,则是一个不错的选择。
保留原始内容,添加文本层将完全按照其暗示的方式运行。保留原始内容,并在其上方放置OCR文字层。此方法不会创建新文档,而是通过添加可搜索文本来更改当前文档。
Quality设置确定新的PDF文档的分辨率,以dpi(每英寸的点数)为单位。
选择Auto Deskew选项以自动纠偏文档。(去歪斜是一个有用的功能,可以矫正歪斜拍摄或扫描的图像)。
最后,单击确定以应用OCR文档。
在许多PDF-XChange Editor对话框中都可以使用页面范围设置。确定页面范围时,请注意以下几点:
使用逗号分隔各个页面。
使用连字符确定页面范围。
如果要定义多个页面范围,请使用逗号分隔页面范围。
在页码前使用破折号确定从文档开头到指定页面的所有页面。例如-7定义了从文档开始到第七页的所有页面。
在页码后使用破折号确定从指定页面到文档末尾的所有页面。例如7-定义了从第七页到文档末尾的所有页面。
是不是非常简单,如果您有如上的问题,那么就可以采用一下这个方法,但是如果还有其他的问题也可以在评论区留言,我们会及时回复的。
PDF-Tools,PDF-XChange Standard、PDF-XChange Editor等产品均已更新至最新版本,感兴趣的朋友可以点击此处,根据自己的需要下载使用。
想要购买PDF-XChange Editor正版授权的朋友,或者获取更多该产品相关信息的朋友可以点击
关注慧聚IT微信公众号 ???,了解产品的最新动态及最新资讯。