基于实体化视图的XML查询处理方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liuxc1112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网新技术的发展,网络服务和信息交换等应用大规模出现。由于网络数据的异种性和异构性,就急需一套统一的数据表式和数据交换的标准。可扩展标记语言(XML)及时解决了这个问题。XML是由万维网协会(W3C)制定的用来描述数据信息的一种标准语言。它具有良好的平台无关性和自描述能力,于是XML逐渐成为网络中表示数据和交换数据的基本格式。随着XML数据在网络上激增,XML数据库的数量及体积快速膨胀,如何高效地管理和查询这些XML数据已成为一个值得研究的重要课题。正如在关系数据库领域,利用缓存的实体化视图可以极大提高查询处理效率,因此对XML实体化视图技术的研究具有重要意义。目前,关于这方面的研究方兴未艾,如何选择合适的XML实体化视图进行缓存,如何利用缓存的视图结果处理XML查询以及如何增量维护XML视图等等都是十分值得研究的问题。本文的主要研究内容为XML实体化视图的选择方法、基于视图的XML查询处理方法和视图的增量维护方法。全文以树型XML为数据模型,路径表达式为视图定义语言。我们主要给出了基于频繁查询模式的视图选择算法、缓存装入算法、查询可回答性定义、基于视图的查询处理算法以及针对多种更新的视图维护算法。理论分析和实验结果表明本文研究的方法的可用性和有效性。第一,我们提出一套选择实体化视图进行缓存的基本方法,包括频繁查询子模式的枚举算法、查询模式频度的计算方法和选择实体化视图装入缓存的算法。第二,我们提出一套基于实体化视图的XML查询处理方法。以查询可回答性概念为基础,我们给出了利用单个视图处理XML查询的算法,并且扩展为利用多个视图的组合处理XML查询的算法,包括XPath及XQuery查询。还建立查询处理的代价模型,并比较分析了基于视图的查询处理代价和直接访问源数据库的查询处理代价。第三,针对XQuery新标准中的插入、删除、替换和重命名四种复杂的更新操作,我们提出一套对缓存中实体化视图的增量维护策略。通过在实体化视图上建立了索引结构PIndex和VIndex,极大地缩小了视图搜索范围。而且给出实体化视图的增量维护算法先后处理间接更新和直接更新。
其他文献
传统的数据库安全机制对于成功数据攻击的防御能力非常有限,有授权的恶意事务可以通过破坏数据的完整性和可用性使得数据库系统不能正常工作。因此,入侵检测技术被用来加强系统
软件测试是软件质量保证的重要手段。随着互联网技术的普及,软件产品已从传统的单机环境迁移到复杂多变的网络环境。因此,研究如何对网络软件进行测试是软件测试领域的一个重
随着Internet的持续快速发展,人们对网络的需求由简单的数据传输向综合的多媒体业务发展。多播技术作为一种可大大节省网络资源的技术在多媒体业务中有着广泛的应用。很多实时
随着企业信息化的发展,企业越来越依赖于网络,Intranet中的关乎企业利益的安全问题越来越受到更到的关注。而如何能够有效地保障网络中这些与企业息息相关的重要数据信息的安全
本文针对XX部机关局域网的安全要求,提出了一套系统、先进和科学合理的网络安全整体解决方案,包括内部网络的安全、远程接入的安全、连接外部网络的安全以及操作系统安全、应用
分布式一致性是指n个处理器组成的分布式系统,其中最多有m个处理器发生故障,要求所有的无故障处理器都能做出相同的决定,并且决定值必须是合理的。区域故障模型是多个局域网中处
互联网的发展为全球范围内实现高效的资源和信息共享提供了方便,同时也对网络安全防护提出了新的挑战。网络入侵检测技术作为一种积极主动的安全防护技术正成为目前网络安全领
不断发生的瓦斯灾害事故带来的是巨大的生命和财产损失,为了让悲剧能够谢幕,我国也在不断地利用计算机等新兴高科技技术来推动瓦斯抽采监测系统的发展。要提高煤矿瓦斯抽采效
基因组重组问题是计算生物学中的常见问题,基因组重组算法对分子生物学中生物进化的研究具有重要意义。早在六十年前,Dobzhansky和Sturtevant发表了一篇重要论文,证明了两种不同
聚类是数据挖掘的重要分支之一,引入模糊理论的模糊聚类分析为现实数据集提供了模糊处理能力,在许多领域被广泛应用。本文在对基于划分的模糊聚类算法中模糊C均值聚类算法及