基于XML的存储系统的研究与实现

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:logepark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机系统性能的不断提高、存储数据量急剧增加以及信息越来越复杂,用户如何高效组织和管理信息成为信息技术的重要课题。文件系统作为操作系统中存储和管理信息的主要构件,在面对海量的复杂的结构化与半结构化信息时暴露出了缺陷。 另一方面,随着计算机网络和硬件的迅速发展,计算机之间的数据交换越来越频繁,需要统一的标准来规范数据的传输和交换。在这种背景下出现了可扩展标志性语言XML,它具有良好的自描述和跨平台性,因此大量的信息以XML的形式出现。 为了对XML文档进行有效的管理,有必要将XML文档存储到数据库中,存储机制已成为XML数据管理领域研究的一个重要课题。 由于将XML文档映射为关系表,存储到传统的RDBMS中,会破坏XML数据的树形结构,造成查询效率下降。所以研究一种以某种自然的方式来存放XML数据的存储系统是十分有意义的。 近几年,专门存放XML信息的数据库已经逐渐出现,但是对关系数据库而言,XML数据库技术还不是那么成熟,还有很多缺陷。 本文通过存储系统的分析,针对这些缺陷,提出了一种新的用于纯XML数据库的存储方案。并且在此存储方案的基础上实现了简单的查询功能。 该方案基于索引结构将XML节点作为记录直接存储到分页文件中,建立起持久化文档对象模型,从而保持了XML数据原有的树形结构。利用符号表和压缩技术,这样不仅降低了XML文档的存储空间开销,而且实现了XML节点的快速串行化输出和访问操作。 作为通用的纯XML存储方案,它支持各种二级索引的创建,以提高XML查询处理的效率。在存储空间、存储时间、串行化和节点访问时间等方面和已由的XML存储系统相比,它是一种高性能的纯XML数据库存储方案。
其他文献
上个世纪末,随着以因特网为代表的信息技术的兴起,复杂网络的研究逐渐引起了人们的注意力。然而复杂网络研究面临着巨大的挑战,其根本原因是实际网络的自身存在着多样性和混乱
无线自组织网络(Wireless Ad hoc Networks)是由一组带有无线收发装置的终端组成的临时性自治系统,特别当这些终端节点具有移动性时,称之为移动无线自组网MANET(Mobile Wirel
随着视频检测技术的发展,视频技术在智能交通系统中起到了更大的作用。视频检测技术可以更方便快捷的检测路况、车流量、车辆违章等现象,同时对其进行适当改进,也可以用于复
人脸识别技术是生物特征识别领域甚至人工智能领域最重要的研究课题之一,该技术已广泛应用于金融、公安、社会福利保障、电子商务、安全防务等多个领域。在整个人脸识别过程
电信行业发展到今天,电信行业普遍面临传统语音业务趋于稳定甚至饱和的情况,各式各样的增值业务将是电信行业未来的关注点。在增值业务领域存在着运营商管理不统一,用户管理
Rootkit是一种新型的恶意程序程序或程序集,设计的目的是用来秘密的控制被攻占的计算机的行为。通过隐蔽后门程序或其他类似的工具程序,使得这些工具程序能在指定计算机上长
本文以海尔的中网发展战略为背景,通过对家庭网络中间件技术的研究,设计了家庭网络中间件系统,从而为下一步提供更加方便智能的家庭网络服务打下了坚实的基础,主要工作包括以
传统的家电已经无法满足现代家庭的需要,人们需要能够自动获取外界信息、能与其它家电协同合作并具有智能化的信息家电(IA),因此信息家电智能化的发展是未来家庭发展的必然趋
XML自1998年由W3C提出之后,已经成为因特网上数据表示和数据交换的新标准,各行各业都在使用XML描述本领域信息,随着XML文档的急剧增加,如何有效存储、管理和查询这些XML数据
随着Internet迅猛发展,接入Internet的用户数量剧增以及服务网络固有的延迟,造成Web服务器负载和用户访问延迟严重等一系列问题,用户的服务质量得不到很好的保证。缓存技术能