数据立方梯度的联机挖掘

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lengyue982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据立方梯度是关联规则在数据立方上的推广和一般化,它描述了立方元组因维值的变化所导致的度量变化,能够支持更复杂、更广泛的假设分析。为了克服传统的梯度挖掘算法从基表开始、象生成数据立方一样计算出立方梯度造成的巨大计算代价,提出了数据立方梯度的联机挖掘MCGO算法。由于数据立方中蕴含了所有的立方梯度,并且在联机分析处理中通常会预先计算数据立方以加速查询响应,因此MCGO算法利用联机分析处理查询得到所需的立方元组,再通过维值匹配和梯度约束判断生成立方梯度,这样不但节省了计算代价,也避免了同时保存立方元组和立方梯度的冗余。将梯度挖掘与联机分析处理集成,也符合用户在浏览数据立方时产生的挖掘兴趣。数据立方的巨大尺寸有可能使得保存和维护一个经过完全计算的数据立方变得不切实际,而浓缩数据立方则可以大大节省存储空间,并且可以在其上构建CuboidTree索引,提高查询效率。在此基础上提出了基于浓缩数据立方的梯度联机挖掘MCGOBC算法。注意到浓缩数据立方的本质是将那些由相同基表元组集合聚集得到的立方元组浓缩到一条基本单元组,并且在CuboidTree索引中具有相同单值维集的基本单元组被组织在一起构成虚小方,MCGOBC算法采取了虚小方查询修剪和基本单元组定向扩展的优化策略,保证了每个虚数据小方都只被查询一次,基本单元组也仅在泛化、具体化和突变方向上进行扩展,从而有利于减少查询开销,提高算法性能。在研究了联机分析处理与数据挖掘集成的联机分析挖掘系统基础上,设计了基于达梦联机分析处理服务器的数据立方梯度联机挖掘工具DM_MCGOBC。
其他文献
作为数据仓库前端工具,联机分析处理(OLAP)是近十年迅速发展起来的一种高级决策支持工具。使用OLAP工具,人们可以深入分析和研究数据,发现趋势,看到异常情况,并得到重要细节以更好
`当今随着经济环境全球化,企业面临着越来越激烈的竞争。大多数有竞争力的企业都把对企业信息化作为他们成功的重要因素。随着信息产业的迅猛发展,新的信息技术层出不穷,对新
该文提出了基于5/3运动补偿时间提升滤波的完全可伸缩视频编码方案.5/3提升滤波能更充分的利用帧间相关性,计算简便,并具有可逆性,便于实现亚象素精度的运动补偿.我们根据5/3
在XML成为互联网上数据表示与数据交换的标准后,XML文档大量涌现,XML的有效管理受到广泛关注。本课题结合国产数据库管理系统的研制需要,开展了XML文档的存储与检索研究。针
本文分析了MPEG第三层标准算法,并在此基础上重点研究了对标准算法中的时频变换和心理声学模型两部分的改进,在时频变换部分,引入小波包变换实现频带的划分,划分后的频带更接近临
随着计算机硬件和计算机图形学的飞速发展,人们对动画、游戏等三维形体真实感的要求也不断提高.与传统的连续型曲面重建造型相比,离散细分方法显然更加适合于计算机的处理,所
近年来,计算机网络技术特别是宽带技术的发展给人们的生活带来了巨大的冲击.可以预见,在不久的将来,Internet将成为人与人之间最主要的交流方式.而流媒体技术的出现与发展将
随着Internet的飞速发展,能够更有效地利用网络带宽资源的IP组播技术研究与应用成为当前科研领域的一个热点.在日益强调服务质量的今天,网络传输中断、网络拥塞以及组播机制
当今信息化时代,各种以数据形式表达的信息几乎以指数的量级在迅速增长,许多隐含在海量数据中的知识正等待人们去挖掘、去发现.作为数据库研究、开发和应用最活跃的分支,数据
实时数据库(RTDBS)的事务和数据具有显式的定时限制,系统的正确性既要满足逻辑约束又要满足时间约束。在实时数据库中完善集成主动规则机制,用于实时数据库的反应式行为。RTD