星型模型数据的轮廓查询算法

来源 :南京大学 | 被引量 : 0次 | 上传用户:darkak
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当代计算机技术和信息技术的不断发展和应用,数据收集手段越来越多,数据存储量越来越大,如何从海量数据中排除一些不会被用户考虑的信息并找出用户最感兴趣的信息,从而为用户做出有效的决策服务,成为了一项重要的研究课题。轮廓查询就是从目标数据集中抽取不被其它任何数据对象支配的数据对象集合,其查询结果能够反映目标数据集的整体轮廓,有利于用户查询到自己感兴趣的目标。因为其在多目标决策、数据挖掘、数据库可视化等方面的潜在应用,近年来轮廓查询引起了越来越多研究者的关注。   近十年来国内外对轮廓查询及其相关问题进行了深入广泛的研究,对轮廓查询的研究大体可以分为五个方面:单表的轮廓查询,多表连接的轮廓查洵,轮廓子查询,不同数据类型上的轮廓查询以及轮廓查询的扩展。现有的对轮廓查询的研究大多集中在对单表关系模型的研究上,在特殊的数据模犁上的轮廓查询研究较少,比说星型模型。数据仓库中主要的模型是星型模犁,另外星型模型数据在数据流中也广泛存在。所以研究星型模型数据的轮廓查询算法,有着很人的应用价值。   在星型模型中的轮廓查询算法面临的问题主要有:(1)需要处理多表连接;(2)需要考虑连接中事实表和维度表的差别;(3)需要处理星型模型这种高维数据模型;(4)需要有针对星型模型的索引机制。传统的算法无法适应这些需求。   本文利用星型模型的特性设计其在不同的应用环境下的轮廓查询算法。在内存环境中,利用事实表中的外键信息将事实表分组,对分组方式的不同,将算法分为SNG、SVG和SDG算法。在外存环境下,利用维度表信息建立起SNTree和SNVTree索引树索引外存块,提出SNTreeIO和SNVTreeIO外存算法以减少轮廓查询中的I/O的次数。在数据流环境下,利用SNTree和SNVTree索引树索引实时数据,并利用SNTreeDS和SNVTreeDS算法计算出实时轮廓。实验表明,这些算法能很好的应用于具有不同数据特征的数据环境下,并且每个算法在其各自的数据结构上表现出较好的性能。
其他文献
随着Internet的迅速发展,中间件作为“网络环境的系统软件”逐渐呈现出功能领域化、形态平台化和应用泛在化的特点,这导致了多个中间件产品及实例需要聚集在一起,通过相互协作来
学位
地质统计学(Geostatistics)是极具发展前景的新学科,从它产生至今近五十年的发展时间里,它的应用范围早已突破了地学领域,在医学、环保气象、农田水利、图像处理等许多领域已
Petri网是目前分析动态系统的一种广泛研究和应用的模型,已经建立了坚实的理论基础,并提出了多种扩展模型,如混合Petri网、时态Petri网、着色Petri网、面向对象Petri网、连续Pet
学位
随着E-Science对高带宽和海量数据传输的需求不断增长和光网络的快速发展,端到端基于电路交换的Lightpath网络开始出现,具有广阔的前景。与此同时,现有的传输层协议,包括多数的适
论辩挖掘是一项研究如何从自然语言文本中自动提取出论辩结构的技术。将论辩挖掘技术应用于用户评论中有着巨大的前景:比如应用于推荐系统中,通过分析用户评论给出可解释的推
以中国通量观测研究网络(ChinaFLUX)为基础平台,开展生态系统碳循环集成研究不仅是全球变化科学研究的重要内容,也是我国应对气候变化的重大科技任务。部署在ChinaFLUX中的通量
随着电子信息技术的发展,数字信号处理器(DSP)技术得到了广泛的应用,特别是数据采集和处理领域更能突显出DSP的重要作用。在需要实现光谱信号采集的仪器设备中,使用功能强大
学位
RFID(Radio Frequency Identification,射频识别)公共服务体系用于在各个拥有RFID闭环应用的企业之间建立一套可靠高效的信息共享机制,包括物品的信息定位、跟踪与追溯、信息查询
学位
区别于传统的存储服务,P2P存储系统是通过够聚合网络上的空闲存储和带宽资源来提供存储服务,而不是基于数据中心。这使得P2P存储在当今具有重要的应用价值:一方面,随着数据中心规
学位
现代城市是一个影响因素繁多,内部关系极其复杂的系统。由于城市系统中各变量之间影响关系错综复杂,因此挖掘城市运行变量之间的隐含关系是城市规划领域中的一个重要研究方向