基于同源元组的分层自索引立方组织形式

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:aaron722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了加速响应联机分析处理系统中的复杂多维查询,通常需要预先计算并保存数据立方。然而数据立方的巨大尺寸却给数据立方的计算和存储带来诸多难题。为了保存数据立方不得不消耗大量的存储空间;同时在计算数据立方所耗费的时间代价中,占支配地位的就是用于存储数据立方的结果集所带来的大量I/O操作。为了从根本上解决这些问题,需要探索有效的数据立方计算和组织方法。 浓缩数据立方(Condensed Data Cube)是一种有效缩小数据立方尺寸的机制,其中基本单元组的浓缩(BST Condensing)是指把那些由同一条基表元组计算聚集得到的立方元组浓缩成一条,从而减小数据立方的体积。最小基本单元组浓缩数据立方(Min-Cube)在浓缩数据立方的基础上,通过完全纪录基本单元组所对应的单值维集(the single dimension set,SD或SDSET),进一步降低了数据立方的存储代价。 在Min-Cube中,存在着多条由相同的基表元组集合聚集而成的元组,这些元组称为同源元组(Homeotic Tuple,HT)。类似浓缩数据立方的思想,在这些由同源元组中有规则的选择一条作为代表,能更进一步的减小数据立方的尺寸,这样形成的新的数据立方的组织形式称为面向同源元组的浓缩数据立方(HTC-Cube)。同源元组浓缩数据立方中非基本数据立方内的各条元组相互之间没有任何直接联系,因此,同源元组浓缩数据立方是一种最简数据立方形式,其尺寸在已知的多种基于浓缩思想的数据立方组织形式中是最小的。 同时,根据面向同源元组的数据立方浓缩组织形式中非基本数据立方元组之间相互无关的特性,可以在分层索引的层次之间体现出查询相关性。因此,将同源元组浓缩数据立方组织成一种分层自索引的数据立方结构,根据非基表元组的索引信息,利用其层次间的查询相关性可以迅速定位其基本数据立方元组,从而取得较好的查询效率。
其他文献
网格计算作为一种提供高性能计算、管理和服务的新技术,已经得到了越来越多的关注。资源发现是高性能网格计算领域中的一个重要研究课题,它的主要任务是根据网格用户的资源请求
uClinux以其优异的性能、源代码开放等优点,成为目前许多嵌入式系统开发的首选操作系统。本课题旨在研究ARM平台上uClinux操作系统的移植与应用程序开发方法,完成网络VOD系统
数字视频的一个显著特点是原始数据量巨大,给传输和存储带来严重挑战。视频编码技术可以将视频数据压缩几十倍,甚至几百倍,有力地推动了视频通信的发展。视频编码器已成为现代网
目前,基于对等网络技术的系统正得到越来越广泛的应用。对等网络所占的网络流量已经超过了Web访问所带来的网络流量,而成为了互联网上最大的流量。而在各种不同类型的对等网
聚类分析作为机器学习领域的重要研究方向之一,吸引了很多学者的关注。在聚类分析中,距离度量是影响聚类算法精度的重要因素。在传统的聚类算法中,一般使用欧氏距离来度量样本之
近年来,由于引入了基于身份的概念,进一步简化了数字签名的密钥管理方式,允许用户自主选择公钥,而私钥由私钥产生中心根据用户信息产生。导致私钥产生中心可以伪造用户的有效
随着网络的普及与发展,虚拟社会逐渐渗透进人们的生活中,出现了很多大型社会网络在线网站如facebook、twitter、新浪微博等,人与人之间透过这些虚拟网络相互产生影响和互动。
随着信息技术的高速发展,智能人机交互系统的应用需求,人脸问题的研究作为计算机领域的核心课题之一,具有越来越广泛的实用价值和研究意义。人脸问题主要包括:人脸检测、人脸
近年来,随着人民生活水平的提高和地面交通的快速发展,城市交通系统的负荷日益加重,如何改善道路交通状况已经成为一个亟待解决的问题。致力于解决各种交通问题的智能监控系统是
随着信息技术的迅速发展,各种学科的信息也在随之迅速膨胀,人们迫切需要这些特定领域的信息检索与管理工具,特定领域文本分类成为当前研究热点。目前,特定领域文本分类主要是在传