基于Xpath路径表达式的选择度估算研究

来源 :中南林业科技大学 | 被引量 : 0次 | 上传用户:bjyueying886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网新技术的发展,网络服务和信息交换等应用大规模出现。由于网络数据的异种性和异构性,就急需一套统一的数据表示和数据交换的标准。可扩展标记语言(eXtensible Markup Language,XML)及时解决了这个问题。XML是由万维网协会(World Wide Web Consortium,W3C)制定的用来描述数据信息的一种标准语言。它具有良好的平台无关性和自描述能力,XML逐渐成为网络中表示数据和交换数据的基本格式。近年来,XML数据量指数级的增长,准确、高效地查询。XML数据成为目前的一个研究热点问题。路径是XML数据的一个重要属性,在XML查询优化研究中,关于路径表达式选择性代价估计是一个重要的研究领域,如何根据路径表达式,特别是复杂路径表达式来完善XML查询优化,提高查询效率是XML查询优化的核心问题。   本文在分析比较了现有路径表达式的选择度估算方法的基础上,以树型XML,为数据模型,XPath为查询语言,结合XML数据结构和XPath路径表达式的特点,研究了一种基于XPath路径表达式的选择度估算方法,主要内容包括以下:   1.分析研究了几种典型的以获得和维护XML统计信息的方法为线索的路径表达式选择度估算方法,并对它们之间的性能进行了综合比较。   2.根据XPath路径表达式中谓词所含条件,结合XML数据结构,从结构和条件两方面对XPath路径表达式进行标记,把XPath路径表达式转换为标记路径表达式,并用算法实现了对XPath路径表达式的标记,处理后的表达式比原来的表达式更加简洁,语义清楚,便于存储。   3.根据XPath查询返回的结果大小和XPath路径表达式所对应的标记路径表达式为XML查询处理器构建统计信息表,根据该统计信息表对XML路径表达式进行选择度估算;最后针对DBLP和Xmark两个数据集,进行了实验测试,并与采用路径树(Path Tree)和马尔科夫表(Markov Table)的路径表达式选择度估算方法进行了估算误差的比较,论证了该方法的可行性。
其他文献
卡车作为一种重要的运载工具,在国民经济的发展中起着越来越重要的作用。但是,由于卡车专用CAD(Computer Aided Design,计算机辅助设计)系统这种大型系列化产品设计过程复杂,目前
随着移动计算、全球定位系统、GIS等相关技术的发展,数据库需要存储和管理大量现实世界中带有时空信息的物理对象,并且它们的空间位置或范围会随着时间的变化而变化,促使时空数
对于涉密信息的保护一直是政府、军队等部门重视的关键问题。之前一直采用物理隔离的方式建设网络,对于涉密网络需要与其他网络交换信息的情况,只能通过手工拷贝的方式实现。
在空间数据库设计中,为了提高数据存取和管理的效率,一般都要为空间数据库建立索引,不同的空间数据索引结构和索引管理技术,直接影响系统的性能。空间数据的复杂性决定了其索引结
社会网络是复杂网络中比较有代表性的现实网络,用来描述社会成员之间的关系。随着网络技术和移动设备的飞速发展,人们的沟通方式变的多样化,社交网站也越来越多。社团结构是社会
具有学习能力和动态适应环境变化的自主角色已经成为商业游戏的一个研究热点,采用传统的基于规则的方法往往无法实现复杂的自主角色的行为,基于此,采用非确定性的神经网络和遗传
环绕智能是近年来提出的一种对未来信息社会的构想,在环绕智能中,人们将置身于一种无处不在的电子环境中,该环境能够迅速地感知人们的行为并做出相应的智能反应。环绕智能(Ambie
城市生态环境的日益恶化使城市森林生态效益评价的重要性越发突显。现阶段,国内外城市森林定量研究主要采用“遥感影像的判读提取+GIS空间统计分析”模式。为了搭建一个用于城
随着网络技术的快速发展,Web应用由于其使用方便已成为网上应用的主流。而身份认证是Web应用的第一条防线,其安全程度直接影响Web应用程序的健壮程度。目前的很多黑客攻击手
在当今激烈的市场竞争中,现代企业组织结构都趋向于分散化、层次化和多样化,也就意味着企业关于客户、产品、销售情况在内的各种信息存在松散性和耦合性。如何更好地利用这些信