“全能数据加工平台”是北京无极天软件技术有限公司开发的软件套件。该软件在PS/S2识别引擎技术、PDF文档处理技术、OFFICE文档处理技术、XML技术、OCR技术等的基础上,提供了一套完整的数据加工软件。该软件包括PS/S2的解版标引、PS/S2/DOC批量转换PDF、PDF/DOC/HTML文档的自动标引、基于XML的数据标引加工、基于正则表达式(模式描述语言)的数据批量处理,以及与主流OCR软件的无缝集成,覆盖了数据加工常用的功能和数据格式。该软件用于将图书、期刊、报纸、网页以及各种文档资料进行标引、加工、处理,生成应用系统或数据库系统需要的数据格式,为数据库建设、信息系统建设奠定扎实的内容基础。 数据加工包括纸质文档和电子文档的加工,全能数据加工平台覆盖了常用格式的电子文档数据处理,对纸质文档的处理则通过集成主流的OCR来支持,集成后同样利用了全能数据加工平台的高效率标引、灵活输出等特性。数据加工系统采用XML和PDF来作为主要的数据加工目标格式。XML数据不仅包含信息本身,还包含了信息的结构,是各种系统交换数据的最佳格式;PDF格式则在原貌展示、网上发布、版权保护、高效率、跨平台等方面具有优势。当然,包括图片、超文本等,或者作为原始文档,或者作为加工系统的副产品,也同样可以提交给目标系统进行使用。
技术特点:
适用领域:
成功案例:
友情链接: |