PDF等文档中文字和CAD图形的识别提取
适用于:PDF、CAJ和图像转电子版文档;PDF中CAD图形提取;
PDF的文字提取和编辑需要用到Adobe的专业软件Acrobat,该软件可完成PDF的所有操作。
如果不安装Acrobat,或是需要识别其他类似扫描件的文字对象,可使用其他OCR软件。
一、CAJ Viewer6.0:国产CAJ格式的阅读器,可识别包括PDF在内的多种文件格式(见下图),准确率良好。
菜单栏-工具-文字识别(点击下拉箭头全部展开才能看见),识别后可选择复制到剪贴板或发送到WPS/WORD。
微软官方的Office组件,office2003默认安装,2007版本需要在安装选项中手动选中;