全能数据加工平台介绍

    “全能数据加工平台”是北京无极天软件技术有限公司开发的软件套件。该软件在PS/S2识别引擎技术、PDF文档处理技术、OFFICE文档处理技术、XML技术、OCR技术等的基础上,提供了一套完整的数据加工软件。该软件包括PS/S2的解版标引、PS/S2/DOC批量转换PDF、PDF/DOC/HTML文档的自动标引、基于XML的数据标引加工、基于正则表达式(模式描述语言)的数据批量处理,以及与主流OCR软件的无缝集成,覆盖了数据加工常用的功能和数据格式。该软件用于将图书、期刊、报纸、网页以及各种文档资料进行标引、加工、处理,生成应用系统或数据库系统需要的数据格式,为数据库建设、信息系统建设奠定扎实的内容基础。

    数据加工包括纸质文档和电子文档的加工,全能数据加工平台覆盖了常用格式的电子文档数据处理,对纸质文档的处理则通过集成主流的OCR来支持,集成后同样利用了全能数据加工平台的高效率标引、灵活输出等特性。数据加工系统采用XML和PDF来作为主要的数据加工目标格式。XML数据不仅包含信息本身,还包含了信息的结构,是各种系统交换数据的最佳格式;PDF格式则在原貌展示、网上发布、版权保护、高效率、跨平台等方面具有优势。当然,包括图片、超文本等,或者作为原始文档,或者作为加工系统的副产品,也同样可以提交给目标系统进行使用。

技术特点
    1、在输入格式方面,支持出版行业的PS/S2系列的各种格式,广泛使用的XML/HTML/PDF/WORD/TEXT格式,以及与OCR的无缝集成 
    2、在输出格式方面,支持XML/PDF通用格式,特别是通过输出模板,还可以生成任何自定义的格式,例如HTML/TRS等格式,或直接提交到数据库 
    3、可以定制字段以及字段的各种属性 
    4、可以输出到文件和数据库系统,可以同时有多种输出 
    5、可以与各种系统配合,成为各类信息系统的数据加工子系统 
    6、大量的自动加工、批量处理、辅助手段,减少录入工作量和出错的可能
    7、图书、期刊的CIP数据、目录格式支持自动处理,自动按目录抽取文章
    8、优良的PS解析技术:版面效果不失真,有效处理内嵌字体、内嵌图片、嵌套版面、EPS图、图形图像、艺术字、字体映射、字符映射、竖排、标点符号、花边、图片裁剪、OLE对象、数学公式、化学公式等。

适用领域
    报社、杂志社、出版社、数据加工企业;可作为数据加工子系统与各种信息系统集成使用、

成功案例
    解放日报、人民日报、无锡日报、电子工业出版社等

友情链接
    全能文档管理系统
    TRS(www.trs.com.cn)
    迪艾姆(www.010dm.com)
    金枫网络(www.k989.com)