支持XML查询代价估计的概要信息树的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户：laopoxqq001

【摘要】

：

XML(可标记扩展语言)数据具有半结构化、自描述性等特点，相对于关系数据来说，XML数据具有更大的灵活性和可扩展性。如今，XML已经成为互联网上数据表达和信息交换的标准。同时，XML

【作者】

：

夏海峰

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2011年期

【关键词】

：

XML数据查询代价估计概要信息树数据测试

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

XML(可标记扩展语言)数据具有半结构化、自描述性等特点，相对于关系数据来说，XML数据具有更大的灵活性和可扩展性。如今，XML已经成为互联网上数据表达和信息交换的标准。同时，XML数据的应用领域在不断增多，XML数据的规模也随之变得越来越庞大。XML数据规模的增长也为XML数据的有效管理和高效查询带来了巨大的挑战。　　目前，提高XML数据查询效率的方法主要有：一、优化XML数据的存储形式和索引机制；二、优化XML数据的查询。XML数据的查询优化曾一度是数据库领域的研究热点，和关系数据的查询优化相同的是XML数据的查询优化也包括逻辑查询优化和物理查询优化两类。XML逻辑查询优化往往会生成多种逻辑查询计划，而如何选择逻辑查询计划并确定不同查询片段的执行顺序，是XML物理查询优化要解决的主要问题。XML物理查询优化的核心思路是通过抽样或者构建概要模型的方式获取统计信息，进行查询代价评估，进而生成物理查询计划。　　本文在深入分析研究国内外相关工作的基础上，设计并实现了一种支持XML查询代价估计的概要信息树：基于Schema的XML概要信息树，简称XSS(XML Schema based XML Synopsis Tree)。本文的主要贡献：　　 1、通过分析XML Schema提出了XML子树同构的概念和XML子树异构的概念。　　 2、基于XML子树同构和XML子树异构的概念，定义了一种基于Schema的XML概要信息树(XSS)。　　 3、给出XSS树的构造算法、XSS统计信息的获取算法，XSS统计信息的更新算法和基于XSS的查询代价估计方法。　　 4、实现了基于Schema的XML概要信息树(XSS)。　　 5、用真实数据及合成数据测试了基于Schema的XML概要信息树(XSS)的时间效率，并验证了其准确性和有效性。

其他文献

复杂背景下的运动人体跟踪算法研究

运动人体的跟踪技术研究是机器视觉领域的核心课题之一,目前被广泛应用在视频编码、智能交通、智能监控、图像检索及军工等众多领域中。本文就低对比度的复杂环境下运动人体

学位

低对比度检测率虚警率局部直方图熵局部灰度熵均值偏移

面光源图像空间绘制技术研究

真实感绘制一直是计算机图形学的一项基本研究内容。它首先在计算机中构建场景的几何模型,然后根据假定的光照条件,计算在最终图像上可见的各物体表面的光亮度,并使用纹理映

学位

自适应空间划分图像空间绘制技术动态面光源图形处理器实时绘制

基于贝叶斯排序学习的关键短语自动抽取

关键短语自动标引技术可以有效地从文本中自动抽取出关键短语，近年来一直是自然语言处理领域的研究热点之一。其中，自动抽取方法是当前主流的标引方法。在本文中，我们对关键短语

学位

关键短语自动抽取排序学习算法朴素贝叶斯模型置信分数AJS评测

社交网络中距离连接查询的设计与实现

随着Web2.0的发展，社交网络迅猛发展。它为人们提供了一个强大的分享、组织、搜索内容和建立联络的平台，已成为人们生活中不可缺少的一部分。日益增多的社交网络之上的应用，如人

学位

社交网络距离连接查询模式匹配分布式环境

校园无线用户行为分析

近年来，随着无线网络和相关智能终端迅速普及和发展，无线网络服务在以前所未有的步伐改变着人们的生活。但是，人们对无线网络的设计、管理、流量监管和服务质量等方面的认知和把

学位

无线局域网大学校园用户行为

基于密码学的在线社会网络隐私保护技术

在线社会网络(Online Social Network,OSN)作为一种新型的Web体系结构,近年来得到广泛的使用。人们使用OSN实现了数据的分享(日志、照片、视频等)和社会关系的维护(通过给朋

学位

在线社会网络隐私保护可验证安全函数估值密钥聚合属性加密访问策略密码学

基于加权有限状态转换器的中文文本正则化研究

中文文本正则化(Text Normalization)是把非汉字字符串转换为汉字字符串以确定其读音的过程。文本正则化在语音合成、语音识别、机器翻译、主题检测、文本挖掘等领域有着重要

学位

文本正则化加权有限状态转换器语音合成

一种GeodeLink到AMBA总线桥接器的设计与实现

近年来嵌入式产品发展如火如荼,在嵌入式系统芯片领域以ARM体系结构为核心的系统芯片长期占有着巨大的市场份额,与此同时PC领域的霸主x86处理器也开始进入嵌入式系统芯片领域

学位

系统芯片GeodeLink总线AMBA总线桥接器协议转换

基于人工免疫系统的带钢表面缺陷检测技术

虽然带钢表面质量检测技术获得了越来越广泛的应用,但是其中一些关键的技术问题仍没有进行有效的解决,例如:带钢表面低对比度缺陷的检测率较低(低对比度辊印、粘结缺陷等),不

学位

人工免疫系统冷轧带钢缺陷检测否定选择算法

在线社会网络中隐私推测机理和关键技术研究

随着在线社会网络用户数目激增，在线社会网络的隐私问题也越来越突出。本论文着眼于在线社会网络中的隐私推测技术，以Facebook社会网络为研究对象，提出了在线社会网络中的隐私推

学位

在线社会网络隐私推测数据预处理

支持XML查询代价估计的概要信息树的设计与实现

与本文相关的学术论文