
产品中心
当前位置:
产品中心 > 全能数字出版内容加工平台 > PDF OCR
PDF OCR
在两种情况下需要用OCR技术对PDF中的文字进行识别:
- 纸质出版物扫描图片,不包含文字对象。通过OCR模块可处理为双层或单层PDF包含文字。
- 有的PDF全部或部分文字,字形正确,但输出的却是乱码。通过OCR可对这样的问题PDF进行修正。
本软件对OCR的支持包括下列特性:
- 内置领先的印刷体OCR引擎,也可以集成文通、汉王等OCR引擎。
- 识别率99%以上,支持中、英、日、韩等多种语言。
- 可以打开PDF识别,也可以直接打开图片识别。
- 可以全页识别(包括倾斜校正和去污,版面分析),也可以识别指定的区域。
- 识别前后独特的对照显示,校对更高效。
- 支持纵校、横校。
- 校对后,可以输出新的双层PDF,或单层PDF(矢量文字)。
- 将OCR技术与本软件在内容分析、反解、标引、输出上的优势充分结合在一起,在一个工具中完成,大大提升数据加工的效率。



