基于模式的XML查询重写及索引技术研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:liusheng123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(Extensible Markup Language,可扩展标记语言)是W3C(万维网)于1998年2月推出的一种标记语言。由于其独特的技术优势,XML推出后很快就成为网络中数据表示及交换的标准。因此,要构建基于XML的各种应用,准确高效的从XML数据源中查询并获取数据就成为其中关键的一步。论文基于这一背景,对XML数据的抽象、查询、索引等方面进行了理论与实验探讨,主要内容、创新、贡献及意义如下: 首先,在分析构建查询系统所需的基本要件的基础上,论文提出了查询体系的总体框架,论述了从文档解析到查询处理的一般过程; 其次,论文基于DTD与XPE树模型,研究了XPath查询表达式的优化技术,提出了三种基于DTD模式树的查询表达式重写方法。通过对重写前后查询时间的比较,证明了重写算法的有效性。 然后,论文提出了一种名为DOBI(DTD Orthogonal B+tree Index)的结构索引,该索引通过查找DTD信息及利用特殊的存储结构,能很好的解决结构化查询中最基本的祖先及后代连接问题,并高效的实现各种查询。经过理论和实际的查询效率分析,证明此方法可快速的确立元素间关系,减少路径访问次数,节约I/O资源,有效地实现XML文档的结构连接,提高查询效率。 接下来,根据Tatarinov等在XQuery的基础上提出的XML文档更新操作语言XUpdate,论文提出了基于DOBI索引的更新算法,该算法能保持文档的有效性,并使得高效的数据更新成为可能。 论文最后对全文所展开的工作进行了总结,并指明了未来的研究方向。
其他文献
随着计算机技术和网络技术的飞速发展, 由此产生的各种数据呈几何级数爆炸式增长, 各种在线数据增长迅速, 促使数据存储容量以每年3 到5 倍的速度急剧增加。大量数据密集型的
为了充分利用并行分布式计算资源解决大规模现实世界问题,并行处理技术和模块化结构已经被广泛地引入了模式识别领域中的分类器设计。本文研究了一种基于训练集划分的问题分解
电子政务(E-government)是指各级政府部门运用先进的信息手段,将政府可公开的信息面向社会、面向公众发布,并使政府的服务工作网络化。实施电子政务有助于政务公开和提高政务各
  本论文对数据仓库,数据挖掘及数据可视化技术进行了归纳总结,深入详细地研究了PMML结构,PMML树模型和PMML关联规则模型,设计了PMML解析器DMVTable,分析了OpenGL技术,设计了图形
本文结合作者在一家手机设计公司的实习经历,详细阐述一款MP3手机的MP3播放功能部分的设计和实现,包括方案选择、与手机基带芯片的硬件接口、软件通信协议等。  总结了一款
实现语义Web构想的关键是创建本体,并使用本体词汇对Web内容进行语义标注。在标注工具中集成信息提取(IE)技术,可大大提高语义标注工具的自动化程度、减轻用户负担。而自适应
  本文对BDD的构造算法进行了分析和改进,给出了BDD包中构造BDD的算法,并分析了该算法存在的问题及相应的改进技术,提出了自己的改进算法:首先是引入了公理系统,将原有的布尔函
随着信息社会的高速发展,信息数据量呈现出爆炸式的增长,当前全球数据中心的数据量堪称海量。据统计,这些数据中有高达60%为重复数据,而它们需要进行不断地存储和传输,这必然会浪
随着国内外主流社会媒体的快速发展,社会媒体已经逐渐取代传统媒体,成为人们发布、分享信息的主要平台。社会媒体给信息传播提供便利的同时也成为突发话题产生与传播的重要平
本文试图设计一种新型的流媒体共享和传输软件:StreamSharer。StreamSharer是一种分布式网络软件,采用了对等计算技术(PeertoPeer),以其各节点平权、资源共享的特点避免了传