基于不完全约束的XML查询处理关键技术研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:jijipanji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML自1998年由W3C提出之后,已经成为因特网上数据表示和数据交换的标准,受到越来越多的关注。各行各业都采用XML来描述本领域的信息。随着XML应用的不断扩展,XML数据量日益膨胀,如何有效管理XML数据并提供高效的查询处理方法成为迫切需要解决的问题。根据查询表达式含有结构信息的特点,已有的查询处理机制可分为结构化查询机制、关键字查询机制和混合查询机制。本文工作针对已有混合查询处理机制存在的问题展开研究,主要研究了以下内容:首先,分析和总结了已有的XML查询方法,针对已有方法不能高效处理包含“*”结点的PSTP查询的问题,提出一种从PSTP查询推断普通结构化查询的方法,基于此,提出一种基于扩展Dewey编码的高效查询处理算法EDPS,可以在仅扫描一遍元素的情况下,处理任意形式的PSTP查询,包括一般形式的Twig查询、不包含“*”结点的PSTP查询和包含“*”结点的PSTP查询。其次,本文利用XML文档的模式信息和文档中的路径信息,提出了基于DTD模式的优化方法来去除无用的查询路径,用以降低EDPS算法的时间复杂度。最后,编程实现了EDPS、TwigStack、TSGeneric、TJFast和pTwigStack五种算法,并在不同的数据集上,通过比较扫描元素数量、运行时间以及扩展性三个指标,对以上五种算法的查询性能进行了实验比较,验证了EDPS算法的高效性。
其他文献
凭借良好的性价比,可扩展性和故障隔离性,机群在科学计算,事务处理和网络服务等不同领域都获得了广泛的应用。   分布式的体系结构和资源特征,决定了机群系统中的典型应用为分
视频监控人数统计是智能视频监控的一个新的应用方向,兼有人群监控与客户流量统计的功能。人群的数量对场所安全管理是一个重要的依据,而客户流量统计则是为商业决策、交通管
基于CT图像的三维重建已成为目前国内外研究的热点,它利用在无损状态下获得的二维灰度图像,重建出符合人们视觉习惯的立体图像。内部裂纹缺陷具有不连续、不规则的特点,以前
20世纪90年代以来,随着“普适计算”计算模式的出现,无线通信、嵌入式计算、传感器及微机电系统(MEMS)等技术的快速发展,具有感知能力、计算能力和无线网络通信能力的微型传感器
资产定价是金融市场发展与完善的一个核心问题,也一直是金融领域的一个基础性研究问题。但目前对影响收益率因素的选取及构造研究普遍存在因素选取任意;没有考虑因素之间相关关
“工业生物技术战略研究与知识环境建设”项目是中国科学院知识创新工程重要方向项目,它旨在通过整合国际与国内工业生物技术领域多类型的数据信息资源,为该领域的科研人员和决
在过去的几十年间,处理器主频与内存访问速度间的差距的日益增大,使得许多程序的性能瓶颈集中在内存访问,体系结构中引入了多级高速缓存的结构(cache)来解决内存访问的瓶颈,程序
工作流技术对于推动企业技术进步和信息产业的发展起到举足轻重的作用,但是由于传统工作流管理系统普遍存在耦合程度高、灵活性低和缺乏智能性的缺点,己不能满足现代应用的需
如今,推荐系统已成为一种与计算机学科和数据挖掘联系紧密的热门技术,在互联网行业中有着重要的地位。推荐系统可以挖掘用户偏好并向用户推荐商品,提高用户满意度和商家的收益。
目前,提出高等职业专业课程设计应以满足产业界的要求为宗旨,即以就业为导向,以新的职业能力内涵为目标构建系统化的课程——即就业导向的职业能力系统化课程开发以成为一个新的