基于内容相关性的XML数据库存储策略和查询方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:davidcao1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对XML数据的"内容相关性",给出了一个基于此的存储策略,同时研究了该存储策略上的相关数据操作.XML数据元素不仅具有层次关系,数据元素之间及数据元素与路径之间同样存在关联的特性,在本文中,这种关联性被定义为"内容相关性".由于"内容相关性"的存在,使得XML数据可以被聚集,分类.而本文中提出的存储策略,就是将XML数据按照"内容相关性"的相关程度进行存储,以期提高XML数据的读取及查询的效率.为了衡量"内容相关性"的程度,同时提出了"相关度"的概念.只有当数据元素之间的"相关度"高于既定值时,才对该数据元素对应的数据值进行聚集存储.基于"内容相关性"的存储,需要与之对应的数据操作方法.在XML数据查询方面,通过将数据查询与数据模式分别看作两个自动机,经过自动机状态匹配生成查询计划,并执行查询计划.在XML数据更新方面,给出三种数据更新策略,分析了不同更新策略对数据库更新效率的影响.
其他文献
本文首先分析了一些已有的自动评价方法,如孤立点测试法、BLEU/NIST方法、GTM方法以及智能度方法等,通过实验验证了他们在英汉翻译评价应用中的可行性,并针对汉语语言的特殊
本文对语音保密通信中必须经历的数模、模数转换过程进行了研究.文中讨论了音频信号在数模、模数转换过程中受到的影响,其中主要包括信道噪声、量化误差、时域漂移、幅值差异
随着现代工业技术的不断发展,机械设备运行周期越来越长,速度也不断变快,人民对于其安全性的要求也不断提高,为此,一种能够实时地检测出机械设备健康状况的方法就显得十分有必要。
目前,以SMP服务器作为结点的机群系统被普遍采用。由于单个结点上多个CPU的使用,机群对结点间的通信带宽提出更高的要求。虽然目前的高性能通信网络得到迅速的发展,但因受物
本文主要研究了设计模式组合技术及其使用,提出了采用UML及其扩展机制表示的用于支持设计模式组合方法的三个模型:模式级模型、带接口的模式级模型和细化的模式级模型,
随着人们对地理信息需求的不断增长和网络技术的飞速发展,GIS技术与网络技术相互融和形成了网格GIS技术。虽然目前网格GIS技术已越来越多地应用于各个领域,但国内农业灌区领
关联规则挖掘首要解决的是效率与伸缩性问题。由于数据挖掘任务所面对的数据集通常是由数以百万计的记录所构成的大型数据库或数据仓库,因此如何提高从大型数据库中挖掘关联
本文从以下几个方面进行了研究:1.汉英双语句对短语结构对齐的研究。利用词对齐、句法分析的结果进行短语结构对齐。研究了两种不同的结构对齐方法:第一种方法只对
本文主要目的是研究适合于交互式语音应答系统的关键词识别技术.研究内容主要包括:1.基于连续隐马尔可夫模型(CHMM)框架下关键词识别声学模型的建立.要想设计一个好的关键词
视频通信存在两大问题,一是网络异构性,二是传输的可靠性。在视频编码方面,分层编码用来解决网络传输异构性问题,多描述编码是解决传输可靠性的有效手段,而多描述分层编码则