用于提高范围查询效率的多维聚簇算法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:betterman_swp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与通讯技术的迅猛发展,与人们生活息息相关的数据变得越来越多。对海量数据进行科学组织和管理的数据库在这期间得到了广泛的应用,研究多维数据的存储与查询也随之成为数据库领域的一个热点。查询作为数据库的一个重要功能,提高查询的效率对提升数据库性能来说十分重要。多属性范围查询是针对多维数据进行查询的主要方式,这类查询一般返回一个记录的集合而不是单个记录。提高多属性范围查询的效率是本文的研究目标。 数据库的文件系统主要包括索引文件和数据文件两部分。于是针对多属性范围查询有两个改进效率的方向:一个是在设计更好的索引机制,另一个是在物理层按照某种策略重新安排记录的排列顺序。本文将采用第二种方法来提高多属性范围查询的效率,即通过多维聚簇的方式使数据文件中的记录以一个更理想的次序存储在外存中,从而减少范围查询过程中的I/O时间。 本文在国内外现有多维聚簇的技术和方法上,对多维聚簇做了进一步探讨。首先细致地分析了该问题,并针对该问题构造了数学模型。然后通过引入光谱算法的思想为解决该NP难问题提供了一种多项式时间内的近似解。接着采用记录与记录集的几何中心的欧氏距离作为衡量记录与整体关联度大小的参数提出了FPF算法,它的时间复杂度和空间复杂度都优于光谱算法。最后通过实验来比较了这些方法在多属性范围查询中的表现。
其他文献
图像处理技术在当今互联网领域已经有了很广泛的应用,伴随着软件服务化和网格等互联网技术发展,图像处理的服务计算及软件共享成为目前生物、医学领域图像处理的趋势。借助于
移动IP是目前唯一支持因特网主机移动的标准。移动IPv6是在移动IPv4基础上发展起来的,它给IP网络带来了一些新的特性,使得IP协议在地址管理、移动性、安全性及多媒体支持方面都
学位
作为多Agent系统目前研究的关键问题之一,Agent协作日益受到关注。Agent之间通过协作比单个Agent具有更强的问题求解能力和更高的智能性,已成为解决大型复杂问题和分布式问题
一个网络可以用一个连通图来表示,其中图的顶点表示网络中的组件,边表示两个组件之间的通信信道。图的连通度可以衡量网络的稳定性。一般来说,一个图的连通性越好,它所代表的网络
由于微博的快速发展,越来越多的互联网用户倾向于使用微博发布有关热点话题的信息。微博中不仅包括相关事实描述的客观信息,也蕴含着微博用户所特有的主观信息,如态度、看法
遥控水下机器人(Remotely Operated Vehicle,ROV)是进行水下作业的有效工具,能够执行勘探、检修、巡查等任务。随着海洋资源的不断开发,很多水下结构物需要周期性的检测与清
近年来,WebGIS在理论、技术、产品以及应用上都取得了很大的进步,其发展有力地推动了地理空间数据的广泛应用。然而由于GIS领域自身特点使其开发受制于Web技术的发展水平,出
学位
说话人识别就是利用人的语音自动对其身份进行鉴别与认证的技术。说话人识别具有广阔的应用前景,已经成为身份认证及人工智能领域研究的一个热点。从20世纪30年代发展至今已经
在IPv6网络中,对组播的支持是必须,组播的通信作用越来越受到重视。组播提供了一种发送方仅发送一份数据同时到多个接收方的高效通信机制,但是组播的安全问题却阻碍了组播技术的
目前云计算环境中的资源主要是虚拟机资源,其核心思想是通过虚拟化技术将数据中心的各种硬件资源进行虚拟化从而形成虚拟资源池,再通过资源调度管理以“按需使用,按量付费”