基于XML半结构数据索引的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:jinyu1016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着WWW(World Wide Web)的迅猛发展,半结构数据的管理已成为数据库领域中的一个十分重要的研究方向。特别是XML(eXtensible Markup Language)作为一种新的数据交换事实上的标准,使得WWW上的数据交换和集成成为可能。将Web上的半结构数据迁移到XML上是对WWW上巨大数据进行有效管理的一项十分有意义的工作。因而,基于XML的半结构数据管理的研究目前已成为国际数据库界的一个重要研究方向之一。 半结构数据索引的研究是半结构数据管理的研究的一部分。半结构数据索引既有与传统数据库相同的部分,也有不同于传统数据库的部分。传统数据库的一部分成熟技术可以比较方便地移植到半结构数据上来。但是,由于半结构数据的特点,半结构数据索也引带来一些新的研究问题。 由于XML的数据表达能力强大,XML完全可以在互联网和数据库之间扮演十分重要的角色。本文对半结构数据索引的研究都基于XML的图模型。目前对半结构数据索引的研究已较为深入,已经有一些较成熟的基于XML的半结构数据索引。针对半结构数据索引的特点,我们主要从数据表示、索引接口、路径模版的形式、索引的导航方式、节点的定义、索引的更新和索引的存储七个方面对这些半结构数据索引进行分析和分类。我们对已有的半结构数据索引都进行了较为详尽的介绍和其特点的分析。特别地,对BUS索引给出详尽的介绍并分析该索引存在的不易文档动态更新的缺点。于是,我们建立了一个支持文档动态更新的半结构数据索引原型系统。我们建立的原型系统,采用与关系数据库结合的模式,具有适应文档频繁更新的优点,使文档节点的插入和删除实现较为容易。最后,我们通过实验数据的分析和比较,验证了在文档內容和结构频繁更新情况下该原型系统半结构数据索引的执行效率。
其他文献
本文介绍了一个自动的检测程序中非连续参数化重复代码的方法。所作的工作有两部分,(1)对Baker的参数化匹配算法进行了改进。把匹配单位由单个的字符变为程序中的语句,为了配合
防火墙作为一种应用最为广泛的网络设备,通常被部署在机构内部网络和外部网络之间的边界位置。防火墙通过检测数据包来控制内外网的数据访问和传输,从而使内部网络不受来自非
首先,该文对国内外目前远程教学系统的现状以及所存在的问题进行了分析,在此基础上,提出并建立了一个基于多Agent的远程教学系统模型.该模型以现代教学理论——建构主义学习
目前,Windows已成为主流操作平台,UNIX版的"储层地质统计分析系统GASOR"(Geostatistical Analysis System of Reservoir)不能适应广大油田用户的需求,开发微机版GASOR势在必
随着民航业的发展以及人们环境意识的逐步提高,机场噪声问题日益突出。机场噪声等值线图是确定机场噪声对居民的影响范围、控制机场噪声以及合理规划机场周围土地使用的重要依
基于武钢"工程图形数据库"项目的实际应用背景,围绕项目的安全需求,重点对数据库中数据的存储安全技术及其实施进行了深入的分析与研究,提出了密文数据库中密文索引树、加密
"断层显示"是油藏描述软件"储层地质统计分析系统(GASOR)"中的一个相对比较独立部分.该部分对地层被断层断开后的状态进行处理,进而实现可视化.断层处理部分是典型的海量计算
图像经过小波变换后,能量与基本特征主要集中在小波系数的低频子带,而对这一部分小波系数的压缩往往是小波图像压缩编码的难点,但这并不表示不能压缩.该论文实验分析结果表明
在互联网技术高速发展的今天,大部分应用程序的开发有一个共同的倾向:基于浏览器的瘦客户应用程序。虽然瘦客户不能提供更好的用户界面,但是它能够避免花在桌面应用程序发布上的
Cobol是一种面向商业的计算机语言,在国内外软件行业中广泛使用。Cobol语言产生于二十世纪六十年代,后来又经过四次完善与增强,在2002年产生了最新的标准—cobol 2002。由于cobo