一种混合时态XML索引模型研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:huanglien
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML应用的普及,对XML文档查询的要求也就越来越高。如果不在XML文档上建立索引结构,那么针对XML数据的任何查询都很可能导致对整个文档树的遍历。对于海量的XML文档这种遍历所花费的开销巨大。因此,建立高效的索引用来查询XML文档成为近来研究的热点。在已有的索引结构中,ViST是一种功能强大的索引。然而,当查询一个XML路径是否存在于XML文档中时,其效率十分低下,并且其搜索结果也可能与XML原文档不符。本文提出了新的索引结构:一种结构编码与簇集索引相结合的XML混合索引(简称HiSC)。XML文档中的每条路径被编成结构编码序列,这些序列与XML树中结点序列一一对应,并将XML树中结点分类保存。查询时,对查询路径进行结构编码,然后将这些编码与XML文档的结构编码进行匹配,找出文档中所有可能的路径。此索引通过减少访问不符合查询条件的数据来提高查询的效率,其查询结果更加精确且包含更多结构信息。同时,HiSC还支持关键字查询。通过在标准的XMARK样本数据集上实验,表明此索引结构在具有高的效率同时具有高的准确性。时态信息处理技术的应用领域越来越广阔,并有向多元化的方向发展的趋势。由于时态信息数据的海量性以及时态信息存在方式的异构性,时态信息处理日益多样化和复杂化。因此,可以将XML技术与现有一些时态技术相结合,从而有效处理时态信息。本文提出了一种支持时态XML文档的模型。此模型支持XML文档保存事务时间和有效时间。通过对标准的XML Schema进行扩充,使XML文档能够保存时变数据。为了更好地支持时态查询和更新,将时变数据分为历史数据和当前数据,采用不同的结构,分别存储。在此基础上提出了时态XML文档更新的方法。从理论上证明此模型同时满足时态一致性和路径一致性。
其他文献
在当前的电子信息技术和网络技术高速发展的后PC时代,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术、商业文化艺术、娱乐业以及人们日常生活中的方方面面。与此同
随着Internet高速发展,人们对安全、方便的身份识别技术提出了更高的要求。传统的身份识别技术防伪性能较差,已经不能适应现代社会对身份识别的要求,当前人们提出了用人体的
网格资源监控是网格若干重要问题中的一个。在网格计算环境中存在各种动态的资源,它们在地理位置上是分布的,在运行平台上是异构的,又可以动态地加入或离开不同的虚拟组织。
近年来随着Internet的迅速发展,互联网用户以惊人的速度增长。一方面,伴随着计算机多媒体技术的不断发展,传统的互联网业务已经逐渐不能满足人们的需求,人们希望互联网能够提供更
星载合成孔径雷达(SAR)具有全天候、全天时、覆盖面积大、快速获取及接近实时等特点,利用SAR遥感技术可及时、准确、全面地监测海洋溢油污染,是溢油监测方面最为有效的手段,目前
本文对基于UML的软件设计模式建模进行了研究。文章针对目前设计模式建模方法的不足,以一个“所见即所得”的文本编辑器的设计建模过程为例,对目前的设计模式建模方法进行分析
现代社会的信息量呈爆发性地增长,数据库技术成为有效地管理这些信息的主要方法。数据可以分为三种类型:结构化、半结构化和无结构化数据,它们在应用中分别主要体现为关系数据、
当今的网络安全问题日益突出,入侵检测系统IDS(Intrusion Detection System)已成为必不可少的安全手段。所谓入侵检测就是检测和识别针对计算机系统、信息系统、网络系统的非
安全问题己经成为因特网进一步普及的一个关键问题。安全的概念不再像过去那样仅仅集中于采用各种过滤机制防止入侵者进入,而是需要提供更高的访问控制以及更加全面深入的安
随着Internet的飞速发展,人们能够比以往更容易、更直接地通过网络获取各种形式的信息。现有的Internet搜索引擎如:Google、Yahoo、WebCrawler等,可以帮助人们搜索Internet上