
功能列表:
• 对期刊内容结构进行自动分析,自动定位每篇文章的起止位置
• 对所有文章进行自动切分
• 生成文章的栏目、目录导航信息,并链接到文章位置
• 结构识别规则可根据出版物的特色进行自定义(如字号、字体、位置、特殊文字等)
• 自动过滤页眉、页脚、页边
• 对文章的标题、作者、来源、页码、日期、期号等元数据进行自动识别、关联和提取
• 识别规则可以根据出版物特定进行定制
• 支持插图、表格的识别、提取、定位和关联
• 支持方便的人工标引、分类
• 集成自动分类、自动摘要等内容挖掘工具(选购)
• 按文章输出元数据、正文、图片等
• 按页面输出页面图及页面描述(所有文字、插图及其坐标)
• 文章段落排版正确,包含必要的空白,图片位置正确,图文混排
• 输出XML格式可自定义
• 加工结果可FTP上传,或加载到数据库
应用于网络出版:
• 原貌版+文字版
• 原貌版基于输出的页面图实现,优点是无需任何阅读器,可实现各种效果(三维翻书效果、幻灯片等),便于版权保护,可添加多媒体广告,实现技术简单灵活
• 文字版图文并茂,可以对文章进行搜索、评论、收费、点击排名等
• 包括栏目、目录导航
应用于移动出版:
• 根据手机、电纸书的小屏幕特点加工数据,例如图片的尺寸限定,满足文字的段落排版、空白等细致要求
• 手机的文章目录导航很重要
• 手机适合展示图片+文字说明
• 可输出epub等格式
• 将文章转成pdf,体积小且可结合成熟的版权保护系统
应用于数据库出版:
• 经过拆分和元数据标引的文章加载到数据库
• 大规模数据库可以用于研究、专题出版,也可以数字图书馆形式销售



