当前位置: 产品中心 > 全能数字出版内容加工平台 > PDF OCR
  PDF OCR

    在两种情况下需要用OCR技术对PDF中的文字进行识别:

  • 纸质出版物扫描图片,不包含文字对象。通过OCR模块可处理为双层或单层PDF包含文字。
  • 有的PDF全部或部分文字,字形正确,但输出的却是乱码。通过OCR可对这样的问题PDF进行修正。

 

    本软件对OCR的支持包括下列特性:

  • 内置领先的印刷体OCR引擎,也可以集成文通、汉王等OCR引擎。
  • 识别率99%以上,支持中、英、日、韩等多种语言。
  • 可以打开PDF识别,也可以直接打开图片识别。
  • 可以全页识别(包括倾斜校正和去污,版面分析),也可以识别指定的区域。
  • 识别前后独特的对照显示,校对更高效。
  • 支持纵校、横校。
  • 校对后,可以输出新的双层PDF,或单层PDF(矢量文字)。
  • 将OCR技术与本软件在内容分析、反解、标引、输出上的优势充分结合在一起,在一个工具中完成,大大提升数据加工的效率。