论文部分内容阅读
围绕数据立方梯度挖掘的三个关键技术即数据立方梯度挖掘算法、数据立方梯度查询以及数据立方梯度挖掘工具,我们开展了四个方面的研究工作:约束性数据立方梯度挖掘研究、实例化数据立方中约束性立方梯度挖掘研究、数据立方梯度查询语言研究、在线梯度挖掘工具研究.该课题的研究成果不仅丰富了数据立方梯度挖掘研究理论而且为国产的达梦数据库管理系统研制通用的数据立方梯度挖掘工具打下坚实的基础.在数据立方梯度挖掘算法方面,主要研究了约束性立方梯度挖掘算法.为了从数据立方中挖掘出用户真正感兴趣的数据立方梯度,约束性的挖掘是一种比较有效的方法.约束性数据立方梯度挖掘的主要目的是从关系表中挖掘出满足指定约束的梯度-探测元组对.LiveSet算法是现有的比较高效的算法.为了减少LiveSet算法的搜索空间进一步提高算法效率,我们利用浓缩数据立方的大小以及其计算时间比较小的特点,提出了基于浓缩数据立方的梯度挖掘eLiveSet算法.在数据立方梯度查询语言方面,我们指出了现有梯度查询语言CubegradeQL查询空间大,效率低的不足并且提出了一种基于浓缩数据立方的新的梯度查询语言dmGQL语言.为了支持dmGQL语言查询,对立方梯度挖掘算法eLiveSet和GSCC做了一些修改,这些修改可以通过eLiveSet算法和GSCC算法输出部分的修改以及算法的扩展来实现.基于eLiveSet和GSCC算法生成的数据立方元组个数,我们给出了dmGQL语言的一个查询代价模型.在数据立方梯度挖掘工具方面,我们研究了在线分析处理与数据挖掘集成的在线分析挖掘系统OLAM系统.在分析了传统OLAM系统的不足之后,提出了在线梯度挖掘工具OLGM.OLGM系统采用了基于B/S模式的三层体系结构,包括客户端、应用层、数据服务层.OLGM系统的实现是基于ASP技术、COM技术以及dmGQL语言.OLGM系统采用松散耦合方式与国产的达梦数据库管理系统集成.