基于分布密度的直方图构造和选择率估计

来源 :河北大学 | 被引量 : 0次 | 上传用户:ywanywhere
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询选择率的估计是查询处理和优化的重要问题之一。在大多数数据库系统中,查询优化的任务是选择一个有效的执行计划,最优计划的选取需要对每个可选计划的代价给出精确的估计。查询选择率的估计是查询优化的关键步骤,其精度直接影响最优计划的选取。目前已经提出了许多查询选择率的估计方法;这些方法当每次收集统计数据时,通常需要额外的I/O操作访问数据库,因而导致昂贵的开销,只能脱机执行或在负载较轻的系统中执行;另外,多数方法只对低维数据有效。例如,当数据不超过三维时,某些直方图方法是有效的,随着维数增加它的性能会迅速下降。因此对高维数据空间的查询选择率进行有效的估计仍是一个备受关注的问题。在对查询选择率的估计方法中,直方图是一种有效的方法。本文提出了一种新的构造直方图的方法,这种方法的主要思想是基于数据区域的局部分布密度建立直方图,进而对查询选择率进行估计。如果在直方图中每个桶的分布密度是一致的或基本一致的,那么用其估计的查询选择率就是精确的。通过实验测试这种方法,实验结果表明同现存方法比较,本文提出的这种方法在低维数据集(包括2维、3维和4维)中具有较高的精度,并且这种方法对于高维数据集(包括25维和104维)也是有效的。
其他文献
无线Mesh网络(WMN,Wireless Mesh Network)是一种新型的宽带无线网络结构。由于其自身的特点,使得这种网络形式已经开始融入到包括家庭网络、企业网、公共网络和智能传输系统
汉语句法分析是中文信息处理领域极具挑战性的课题之一。其任务主要是:根据特定的语法把给定的句子转化为词语之间彼此关联的结构形式。随着大数据与信息处理技术的发展汉语句
移动ad hoc网络由于其自身的特点,使其相对于传统的有线网络而言,更易遭受攻击,因此对ad hoc网络的安全的研究成为一个热门的研究课题。   入侵检测作为保护系统和网络安全的
随着经济的快速发展,企业对控制系统的要求也越来越高。但是,自封闭式的传统控制系统难以实现设备、系统、外界之间的信息交换,存在严重的“信息孤岛”现象,难以满足企业对企业信
学位
三维线条的绘制在图形学与可视化领域中有着广泛的应用,如三维模型的线绘制,弥散张量成像纤维(DTI Fibers)的绘制,以及流体可视化中流线(Streamlines)的绘制等。与其他的表现
随着经济贸易的增长,物流效率的提高成为物流产业发展的一个主题。集装箱作为物流活动中最为重要的工具之一,其优化问题的研究直接影响着企业物流费用的支出。集装箱装载问题是
自20世纪90年代以来,信息检索正在向着领域化、智能化方向发展,而提高检索的质量,推出令人满意的检索技术成为了全世界范围的研究前沿和热点。本体作为表达知识的共享概念模
目前,网络拥塞算法主要在源端、网络端和基于控制论这三个领域。本文是基于控制论这个领域进行研究。论文在介绍网络拥塞的概念、原因和研究状况的基础上,分析常见的拥塞算法
位基服务(LBS, Location-Based Service),一直以来是一个研究热点问题。随着移动互联网的迅猛发展,近几年来,智能移动终端越来越多地出现在人们的工作和生活中,扮演着举足轻
随着互联网技术的飞速迅猛发展,互联网用户可以更加容易地从网络上获取日常关心的热点话题。网络新闻已然成为人们获取新闻信息的主要媒介之一,相比传统新闻媒体,网络新闻在