电子图书资源系统集成的应用研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:AsiaITt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文以数字化图书发展过程中面临的困难——异构电子数据资源给读者的使用带来不便为背景,介绍了目前为了实现电子资源的“一站式”查询,而在电子资源系统集成时所采取的通用解决方案;同时针对现在应用广泛的印刷电子资源的组织方式,提出了基于公共对象请求代理体系结构的异构电子数据资源集成系统的解决方案,并应用此方案将印刷电子文档转换至通用数据库管理系统中,实现电子图书资源系统的集成。电子图书资源系统集成的目标是将电子文档格式进行屏蔽,以便于对印刷电子文档进行统一的检索,实现“一站式”查询。  论文在深入了解当前电子文档的基础上,主要完成了如下工作:  (1)对公共对象请求代理体系结构在电子资源集成方面的技术,论文通过比较几种电子资源系统集成的方法,给出了采用公共对象请求代理体系结构技术解决电子资源集成的原因。论文实现了基于公共对象请求代理体系结构的中间件系统,使用三层体系结构,完成了电子图书资源系统的集成。  (2)论文以印刷电子文档为具体实例,分析了当前流行的电子文档格式,电子文档从逻辑上分为对象、文件结构、文档结构、页面四部分进行描述;从物理上分为文件头、文件体、交叉引用表和文件尾等四部分进行描述。论文通过对印刷电子文档的结构进行分析研究,为提取电子文档信息提供支持。  (3)论文以PDF文档为示例,实现了文档信息的读取。采用内容流解码的方法将文档中的信息读取出来,并对篇章结构进行了初步的划分。系统实现主要划分为四个模块:类型识别模块、转换模块、处理模块和存储模块。首先将文档转换成文本文档,再对转换好的文本文档进行进一步的处理,修正诸如文件标题、摘要、正文、参考文献等的控制标记,便于电子文档有用信息进行方便的处理、共享和交换。  
其他文献
随着移动互联网的迅猛发展和移动终端设备的不断升级,人们可以随处拍摄视频并将其上传到远程服务器。但是由于视频占用的空间较大,给互联网的存储空间和网络带宽带来了巨大的
近年来,随着计算技术、通信技术的飞速发展,特别是互联网的迅速普及和3C(计算机、通信、消费电子)合一的加速,微型化和专业化成为发展的趋势,嵌入式产品成为信息产业的主流。
语义缓存是一种基于历史查询及其描述的缓存技术,在分布式计算环境有广阔的应用环境,因其节约网络开销、节省查询处理时间、支持并发和网络断接下的数据处理等特点而具备很好的
本文着重研究了数字图书馆的信息查询系统,对其关键技术—Web数据库连接技术和Web数据库查询优化算法,进行了具体的分析和比较,提出了采用ADO和ASP技术的Web数据库连接技术和基
随着科学技术的迅猛发展,信息技术和网络技术伴随着这股风潮如雨后的春笋一般生长和壮大。数据库作为承载这两种科技技术的核心载体,也在不断的发展和转变。从最初的网状、层次
当前分布对象技术的发展,在为开发高性能、可扩展的分布式企业应用软件提供技术基础的同时,也将软件置于复杂环境中。分布式企业应用软件结构复杂、涉及多种技术,对设计开发人员
组播技术是一种从单个发送端同时传输数据到多个接收端的有效手段,这个优点使它成为当前网络技术中的研究热点。但伴随着组播应用的发展,它的拥塞控制问题变得也越来越重要,
随着图像科学各基本理论的进展,数字图像处理技术在国民经济各部门得到广泛的应用。数字图像处理技术作为计算机科学的一个重要研究领域正在受到广泛的重视,数字图像处理技术已
随着Web服务技术的发展,Web服务相关标准的完善,支持Web服务的平台的成熟,网络中可以实际应用的Web服务越来越多,基于Web服务的应用技术成为当前电子商务的一个主流技术。然而,现
本文主要围绕着开放源码的入侵检测系统Snort中模式匹配算法展开的一系列的工作。 首先,从Snort系统入手,分析此系统工作的原理,介绍特征分析和协议分析。重点对系统中规则的