一种新的纯XML数据库索引机制

来源 :中山大学 | 被引量 : 0次 | 上传用户:dreamastlxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML应用的普及,对XML文档查询的要求也就越来越高。如果不对XML文档建立索引结构,那么针对XML数据的任何查询都很可能导致对整个文档树的遍历。随着XML数据集的增大,这种遍历所花费的开销是不可忍受的,XML索引结构的提出正是为了提高查询的效率,在速度与准确性两方面为查询提供更大的灵活性,通过减少访问那些与查询不相关的数据集来实现快速查询。 本文在结合XISS系统和LSDX编码方法的基础上,提出一种新的索引机制——IMDX(IndexingMechanismforDynamicallyUpdatingXMLData,支持动态更新XML数据的索引机制)。该索引机制引入了一种新的编码方法,对XML数据树的每个结点进行唯一编码。通过结点的编码,可以快速地得到任何两个结点间的关系。IMDX在结构上由元素索引,属性索引,名字索引和值索引组成,通过这些索引,我们可以由元素或属性的名字快速地得到同名元素或属性的结点。对于给定的路径表达式语句,采用分解的方法分成足够小的查询单位,再对它们根据结点间的关系进行连接,最后得到查询结果。 本文的创新点主要体现在以下几个方面:提出了一种新的对结点进行编码的方法,有效地解决已有的XISS系统中不完全支持结点更新的问题。并给出了一次遍历就可以建立索引的算法,提高了索引建立的效率。从结点的编码中可以判断出结点路径,从而简化了索引机制,减少了索引文件占用的空间。对传统的路径连接算法进行了改进,解决了路径连接时将无用结点也参与连接的问题,从而提高计算和存储效率。 通过实验,我们把IMDX系统和XISS系统进行了比较,IMDX不仅比XISS系统更好地支持结点的更新,而且索引的建立时间和查询的复杂度都得到很好的改善。
其他文献
随着计算机网络技术的发展和普及,信息化己经深入到社会的各行各业,电子政务是当前我国信息化工作的重点,各级政府都在建立自己的电子政务系统。要取得电子政务系统的成功,必
随着网络技术的迅猛发展和各种应用的广泛开展,网络信息服务的基本平台——网络服务器正面临着两方面挑战:负载的不断增加和负载的多样性。集群系统凭借其在可靠性、高性能、
世界卫生组织(WHO)和国际联合会(IDF)认为糖尿病是21世纪最有挑战性的医疗保健。糖尿病的并发症和死亡率和经济挑战将影响个人,家庭,企业甚至整个社会。在沙特阿拉伯1980年的经
随着互联网的飞速发展,互联网已经成为一个巨大的知识库。为了有效地利用互联网上的信息,信息抽取技术应运而生。信息抽取技术属于人工智能的一个分支。使用信息抽取技术可以人
近年来,随着我国正式进入WTO,如何提高国有企业的竞争力已经成为了各方面关注的焦点。很多企业都已经认识到,MIS的建立可以提高各部门业务工作的效率,能够带来明显的经济效益
异构数据源集成是实现企业应用集成的关键,是解决网络条件下“信息孤岛”问题的有效途径。 随着计算机和网络技术的发展,企事业单位都陆续建成一些应用信息系统。由于各部
随着基于网络的信息服务系统规模尺度和复杂程度的快速增加,信息服务的部署和运行不可避免会受到异构网络服务能力差异、软硬件资源失效与性能退化、用户访问行为不确定以及外
近年来,随着计算机网络的发展,网络技术不断涌现出新的技术和发展方向,从最初的HTTP, FTP, SMTP等协议到后期的HTTPS, WEB2.0,云计算:从最初单纯的C/S模式到后来的P2P网络模型
随着网络的发展和Web资源的丰富,利用Web全文信息检索系统来获取所需信息已经成为人们日常生活的重要组成部分,用户也越来越关注如何能够更加准确、高效地查找信息。本文对We
随着Internet技术与电子商务的迅速发展,改变了人们的生活和工作方式,给社会带来了极大的经济效益,同时也带来了许多安全隐患。因此,安全服务正成为Internet和电子商务应用中一种