汉王数字图书馆解决方案

［ eNet硅谷动力更新时间：2006/8/21 ］热 ★★★

　　第一部分背景概述

　　互联网的普及，改变了人类获得、拥有、利用、处理、交流知识的方式。但在互联网上，英文信息占97%，法文信息占2%，中文只占千分之几。中文信息资源开发和建设已成当务之急。建设中国数字图书馆工程不仅将扭转互连网上中文信息匮乏的状况，而且将极大促进国民经济新的增长，推动我国信息技术的发展和信息化的建设，同时，图书馆的工作方式和服务模式将得到跟本性的改变，全面实现自动化、网络化和信息化。目前，我国各级政府对数字化图书馆工程非常重视，国家专门成立了“863”计划数字化图书馆战略小组，北京市把数字图书馆建设列为四项高科技基础工程之一。这是一个运用现代高科技的数字资源系统工程，涉及到信息资源加工、存储、传输、检索和利用的全过程，是信息基础建设的重要组成部分。

　　数字图书馆就是对有高度价值的图像、文本、语音、音响、影视、软件和科学数据等多媒体信息进行收集，组织规范性的加工，进行高质量保存和管理，实施知识增值，并提供在广域网上高速横向跨库连接的电子存取服务。同时还包括知识产权、存取权限、数据安全管理等范畴。简而言之，数字图书馆是超大规模的、可以跨库检索的海量数字化信息资源库，能为读者方便、快捷地提供信息的服务机制。数字图书馆的特点是：收藏数字化、操作电脑化、传递网络化、信息存贮自由化和资源共享化。

　　数字图书馆作为一个海量、宽带多媒体网络系统，还有很多需要进一步研究开发的技术问题，这些问题主要表现在：

　　1) 信息资源建设

　　数字图书馆要把文本、声频、视频等各种信息资源整理入库。自动分类、自动标引、自动文摘、工业化的OCR技术等技术都是技术瓶颈所在。

　　2) 存储与压缩

　　数字图书馆面临的数据是多种类型的、海量的。如何保存和管理海量数据是系统设计的核心任务之一。

　　3) 分类、索引、检索：

　　对不同的内容，不同的数据类型需要不同的分类体系和索引机制。检索工具应保证提供给用户的信息恰恰是用户最需要的。因此，海量数据的搜索效率与速度是系统面临的巨大挑战，其中包括中文搜索、图像搜索、语音搜索、智能搜索。

　　4) 传输与保护问题：

　　海量信息的快速浏览需要建立一个合理的分层传输机制，保护包括版权的保护和系统安全性的保护。

　　基于领先的OCR（光学字符识别）技术和内容管理技术，北京汉王科技公司推出包括资源建设、资源检索利用两个重要环节的数字图书馆应用方案。

　　第二部分数字图书资源建设

　　一、“汉王OCR录入工厂系统（网络版）”加工方案：

　　信息资源对于网络时代，正如蒸汽机于工业社会，我们致力于信息资源建设，正是在构建未来社会的基石。要丰富网络资源，提高原有信息知识的利用效率，对图书、文献、档案等信息资料的数字化就显得尤其重要。

　　但如何将种类繁多的文档资料、行业信息进行自动化处理，以满足各种数字化信息的应用，这就是OCR技术（光学字符识别）在信息数字化建设中起到的至关重要的作用。

　　1、总体功能:

　　实现大量原始资料的快速扫描录入与保存；

　　OCR录入、校对、整理；

　　数据库存储、备份、检索和管理；

　　对各工序环节能进行监督和调度协调；

　　员工岗位的管理；

　　质量控制；

　　系统管理。

　　2、系统特点：

　　1) 大量原始资料的快速扫描录入与保存

　　各种版式的现代书籍: 横版、竖版、简体、繁体；

　　古籍：特别是珍本、善本；

　　各年代的报刊杂志及内部资料；

　　各年代公文档案；

　　各种报表或票据。

　　2) 汉字识别之王：国际领先的OCR录入、校对、整理功能

　　采用汉王先进的OCR识别技术，识别率高、速度快；快捷精确的横校、纵校、对比校对；支持多种电子文档存储格式：PDF、HTML、RTF、TXT、XLS，方便地实现全文检索，并将逐步与国际标准电子文档格式接轨。

　　3) 完善的员工管理功能

　　综合了考勤管理、岗位管理、工资管理三大功能，系统自动记录员工出勤情况，自动为各岗位分配工作并记录分配情况及工作量，并根据以上记录情况生成员工工资明细表；提供轻松友好的工作界面。

　　4) 自动进行各工序环节的监督和调度协调

　　服务器给各岗位分配任务，并进行任务协调，使各客户端的任务既相互独立又形成完整的生产流程，提高工作效率，使得文字处理速度可达到每人班10-12万字，比手工录入的效率提高5－8倍。系统自动进行员工工作量计算、差错量监控，可将整体差错量控制在万分之二以内，从而达到了出版质量要求。

　　5) 对本套系统的监控、管理及日常维护，并定期生成安全日志

　　二、系统结构：

　　1、系统网络结构图：

　　2、网络拓扑结构：

　　三、系统功能描述：

　　汉王OCR海量录入软件系统具备四大功能：文字自动录入、流水线管理、质量控制和员工管理、系统管理。

　　第三部分数字资源的检索、利用

　　数字图书馆建设内容为根，服务为本。汉王图书馆数字化内容管理解决方案是以图书馆的各种类型数字资源为中心，以为读者提供方便、快捷的信息服务机制为目的，围绕内容的收集和加工整理、内容的创建、内容的存贮和管理、内容的发布和传递、内容的查询和检索、内容挖掘等内容管理所涉及的项目提供的一整套基于WEB的数字化内容管理解决方案。

　　一、方案特点：

　　成熟稳定、独具特色的非结构化数据库支撑环境；

　　国际领先的中文全文检索技术；

　　全面、高效、灵活的信息服务体系。

　　二、系统功能：

　　汉王图书馆数字化内容管理解决方案包含三个层面的内容：

　　通过汉王图书馆数字化内容管理解决方案，以各种方案存贮和管理的各种类型数据资源可以进行有效的加工、索引、管理并在网络上提供各种贴近读者的信息服务。

　　三、便捷、高效的网站建设和维护：

　　图书馆信息服务的网络化已成必然。信息发布是网上图书馆的基本要求，是实现图书馆信息共享的主要途径，而通过普通Web服务器来发布信息无法满足具体应用中在易维护性、安全性、检索等方面的需求。汉王网站建设和维护方案的宗旨就是便捷、高效。汉王信息发布系统一方面可以把Web站点繁杂的维护工作转换为数据库记录的维护，轻松管理海量数据，另一方面，可以利用动态访问数据库技术实现信息检索、动态导航、简繁内码自动转换等普通Web服务器所无法实现的功能。

　　基于5年多来在Internet/Intranet应用信息系统开发方面积累的经验，汉王目前可以提供多层次的信息发布方式，满足多种应用的需求。用户既可以完全依赖汉王的发布功能，轻松完成Web站点的全部维护工作，也可以把汉王信息发布的各种功能按照“组件”的形式使用，按照自己的意愿创建Web服务。

上一篇文章：中国戏曲学院神獒VPN应用解决方案

下一篇文章：英克ERP医药行业解决方案

【发表评论】【打印此文】【关闭窗口】

品牌总网版权与免责声明：
本网站（www.ppzw.com）刊载的所有内容，包括文字、图片、音频、视频、软件、程序、以及网页版式设计等均在网上搜集。访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。
※ 联系方式：品牌总网管理客户服务部电话：0595-22501825

图片资讯

1 2 3

社会动态

视频推荐

商机在线

分类信息

图片新闻频道

招商加盟

Email:qy@PPzw.com