数据立方的存储组织与索引

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:limitU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据立方的巨大尺寸为它的存储和维护带来许多难题,并且导致了巨大的查询代价.为了从根本上解决这些问题,需要探索有效的存储组织方法,尽可能缩小数据立方的存储开销;同时辅以适当的索引机制,进一步加速数据立方查询响应,并且方便对数据立方进行快速的更新维护. BU-BST浓缩数据立方是一种有效缩小数据立方尺寸的浓缩机制,它被进一步扩展为BU-EST浓缩数据立方,两者的本质都是将那些虫相同基表元组集合聚集得到的立方元组浓缩到一条.BU-BST浓缩数据立方只能发现相同基表元组集合汉包含一条基表元组的情形,而事实上这个相同基表元组集合还可能包含多条元组,BU-EST浓缩数据立方可以发现这种情形并进行相应的浓缩,因此具有更好的浓缩效果.研究了利用CuboidTree更新BU-BST浓缩数据立方的问题,并且实现了大批量增量更新的方法,保证更新结果等价于完全重新计算的结果,且提高了更新效率.实验结果表明:利用CuboidTree索引BU-BST浓缩数据立方,可以减小数据立方的存储开销,提高数据立方查询效率,同时还易于进行更新维护.
其他文献
本文在不确定时间点的时态关系基础上给出了不确定时间区间的定义和“同时”时态关系。由于病历数据的特点和关联规则挖掘的要求,采用附加约束并包含复合项的DHP算法,结合不确
软件测试是软件开发周期中重要的一环,用于检测软件存在的故障和缺陷,是保证软件健壮性和安全性的主要途径之一。随着软件的复杂性和规模的增加,软件测试的开销也进一步上升,自动
面对海量的信息,人们已经无从选择。信息开始从用户主动获取演变成系统根据用户的需求和喜好进行个性化推荐,推荐系统应运而生,并迅速得到广泛研究和应用。协同过滤的算法是目前
生物界中昆虫或动物的迁徙行为对于种群的生存有着至关重要的作用。为了维持物种的生存与稳定,生物界一些群居动物有着严格的等级制度和职责分工。这种严格的等级制度,确保了个
创建逼真的三维人脸模型是计算机图形学领域一个极富有挑战性的课题。随着虚拟现实、影视制作、游戏娱乐、可视电话等应用的发展,这一研究领域越来越受到人们的关注。本文主要
随着信息技术的不断发展和企业竞争的加剧,数据挖掘越来越多地应用于企业的生产和管理中。这一趋势的持续和企业数据的膨胀,只靠传统的单机已难以胜任,此时采用并行处理技术是解
流媒体是一种在网络上实时流式传输的连续时基媒体用户可以一边下载一边对接收的部分数据进行播放流媒体应用涉及实时技术多媒体技术高吞吐量存储技术高速网络技术通信技术等
随着社会的发展,技术的提高,全世界范围内的各个企业都在经历一场深刻的变革。企业开发市场面临的主要任务不再是不断追求产品的质量了,这从技术上已经没有任何问题了。任何企业
电子商务是20世纪90年代初期在美国等发达国家兴起的一种崭新的企业经营方式,它是一种通过网络技术的应用,快速而有效地进行各种商务活动的全新方法。电子商务给人们带来方便的
该文首先探讨了数据挖掘的基础理论,简述挖掘系统的开发标准和其体系结构的演进过程;然后讨论了描述软件体系结构的"4+1"视图,并给出几种主要的体系结构风格.基于对数据挖掘