支持XML查询代价估计的概要信息树的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:laopoxqq001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(可标记扩展语言)数据具有半结构化、自描述性等特点,相对于关系数据来说,XML数据具有更大的灵活性和可扩展性。如今,XML已经成为互联网上数据表达和信息交换的标准。同时,XML数据的应用领域在不断增多,XML数据的规模也随之变得越来越庞大。XML数据规模的增长也为XML数据的有效管理和高效查询带来了巨大的挑战。   目前,提高XML数据查询效率的方法主要有:一、优化XML数据的存储形式和索引机制;二、优化XML数据的查询。XML数据的查询优化曾一度是数据库领域的研究热点,和关系数据的查询优化相同的是XML数据的查询优化也包括逻辑查询优化和物理查询优化两类。XML逻辑查询优化往往会生成多种逻辑查询计划,而如何选择逻辑查询计划并确定不同查询片段的执行顺序,是XML物理查询优化要解决的主要问题。XML物理查询优化的核心思路是通过抽样或者构建概要模型的方式获取统计信息,进行查询代价评估,进而生成物理查询计划。   本文在深入分析研究国内外相关工作的基础上,设计并实现了一种支持XML查询代价估计的概要信息树:基于Schema的XML概要信息树,简称XSS(XML Schema based XML Synopsis Tree)。本文的主要贡献:   1、通过分析XML Schema提出了XML子树同构的概念和XML子树异构的概念。   2、基于XML子树同构和XML子树异构的概念,定义了一种基于Schema的XML概要信息树(XSS)。   3、给出XSS树的构造算法、XSS统计信息的获取算法,XSS统计信息的更新算法和基于XSS的查询代价估计方法。   4、实现了基于Schema的XML概要信息树(XSS)。   5、用真实数据及合成数据测试了基于Schema的XML概要信息树(XSS)的时间效率,并验证了其准确性和有效性。
其他文献
运动人体的跟踪技术研究是机器视觉领域的核心课题之一,目前被广泛应用在视频编码、智能交通、智能监控、图像检索及军工等众多领域中。本文就低对比度的复杂环境下运动人体
真实感绘制一直是计算机图形学的一项基本研究内容。它首先在计算机中构建场景的几何模型,然后根据假定的光照条件,计算在最终图像上可见的各物体表面的光亮度,并使用纹理映
关键短语自动标引技术可以有效地从文本中自动抽取出关键短语,近年来一直是自然语言处理领域的研究热点之一。其中,自动抽取方法是当前主流的标引方法。在本文中,我们对关键短语
随着Web2.0的发展,社交网络迅猛发展。它为人们提供了一个强大的分享、组织、搜索内容和建立联络的平台,已成为人们生活中不可缺少的一部分。日益增多的社交网络之上的应用,如人
近年来,随着无线网络和相关智能终端迅速普及和发展,无线网络服务在以前所未有的步伐改变着人们的生活。但是,人们对无线网络的设计、管理、流量监管和服务质量等方面的认知和把
在线社会网络(Online Social Network,OSN)作为一种新型的Web体系结构,近年来得到广泛的使用。人们使用OSN实现了数据的分享(日志、照片、视频等)和社会关系的维护(通过给朋
中文文本正则化(Text Normalization)是把非汉字字符串转换为汉字字符串以确定其读音的过程。文本正则化在语音合成、语音识别、机器翻译、主题检测、文本挖掘等领域有着重要
近年来嵌入式产品发展如火如荼,在嵌入式系统芯片领域以ARM体系结构为核心的系统芯片长期占有着巨大的市场份额,与此同时PC领域的霸主x86处理器也开始进入嵌入式系统芯片领域
虽然带钢表面质量检测技术获得了越来越广泛的应用,但是其中一些关键的技术问题仍没有进行有效的解决,例如:带钢表面低对比度缺陷的检测率较低(低对比度辊印、粘结缺陷等),不
随着在线社会网络用户数目激增,在线社会网络的隐私问题也越来越突出。本论文着眼于在线社会网络中的隐私推测技术,以Facebook社会网络为研究对象,提出了在线社会网络中的隐私推