基于流立方体的频繁模式挖掘算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:cot01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,人们在日常事务处理和科学研究中积累了大量宝贵的数据。为了更有效地发现隐藏在丰富数据背后更为有用的知识,数据挖掘技术得到了越来越多研究学者的关注,成为信息科学领域一项极具研究价值的重点课题。频繁模式挖掘作为数据挖掘领域的一个基本问题,其主要目的是为了发现给定数据中反复出现的联系,一直都是国内外众多学者的研究热点之一。数据流是一个近年来数据库研究领域中被广泛提及的热门概念,它被描述为一种动态、连续、无限且内容变化快速的数据模型。随着信息化产业的发展,数据流应用领域越来越多,数据流挖掘也逐渐成为一项极富应用前景的研究领域,数据流频繁模式挖掘更是在近年来受到广泛重视。   本文通过对数据流应用领域中数据类型的分析,发现在很多应用中,数据流的每项数据可被看作一条关系型记录,这种数据结构具有多维、多层次的特点。对这种类型的数据进行进一步分析,可以使研究人员从各个不同的角度和方面更好地认识某些事实,进而获取更多数据中隐藏的知识。在传统数据仓库中,为了对多维、多层次数据进行高效地分析,研究者们使用了数据立方体结构和OLAP技术有效地完成了分析工作。与传统静态数据不同,数据流具有数据产生速度快,数量无限等特点,传统的多维数据处理方法便不再适用于数据流模型。数据流立方体概念的提出正是为解决这个问题提供了一个较好的途径和思考方法,本文通过对数据流立方体体系结构概念的研究,分析在现有流立方体的实现方法上存在的诸多不足之处,例如查找方法落后、查询响应效率低等问题,并设计了一种优化了的ANH-tree数据结构来解决以上问题,根据该新的数据结构实现了一种更高效、更合理的查询响应算法ANH-cubing,提高了流立方体处理数据流的能力。传统的多维、多层数据挖掘方法的研究已经获得许多成果,但是在数据流挖掘中类似的研究成果还尚少,本文中在优化了的流立方体基础上实现了针对多维、多层次的数据流频繁模式挖掘的算法ANH-Ming,该算法具有稳定性、多维性、多层次性的特点。通过实验结果分析,该算法能根据用户定义的维与层次信息有效、准确地挖掘出不超过倾斜时间框架的所有频繁模式。最后,并根据文中提出的挖掘算法实现了一个挖掘工具,通过实际验证具有效性和一定的实用性。
其他文献
电子商务是一种以Internet/Intranet网络为架构,以交易双方为主体,以银行支付和结算为手段,以客户数据库为依托的全新的商业模式。电子商务作为全球经济发展的最终趋势,将成
学位
发展党内民主提升党的创新能力是巩固党的团结统一的重要保证,是党的建设新的伟大工程的重要内容。本文阐述了党内民主是党的生命力的源泉,发展党内民主提升党的创新能力关键
随着互联网的飞速发展,大量信息在我们的日常工作和生活中不断产生和积累。目前整个Web信息量已经超过了200,000TB,且随着人们业务的不断深入和发展仍将不断增长。为了利用这
随着计算机科学软硬件技术的飞速发展,互联网的高度发达,云计算的实用化进程已经获得了质的飞跃,不仅为广大厂商、媒体以及用户所认可,同时也为IT产业链上的各个环节都带来了
目的 探讨凝血相关指标在慢性阻塞性肺疾病急性加重期( AECOPD)的改变及与肺动脉高压( PH)的关系.方法 选取168 例AECOPD患者作为AECOPD组, 根据肺动脉收缩压( PASP)分为无PH
随着计算机、多媒体以及网络技术的迅速发展,人类进入了信息时代。随着社会的信息化,越来越多的数字图像资源出现在人们的生活中,如何对规模越来越大的图像数据库进行有效的
随着计算机视觉技术和计算机图形学技术的发展,三维重建技术的应用领域从机器人导航和视觉检测等高端领域扩展到了虚拟现实、视觉模拟等领域,而且在文物保护、生物医学、建筑
XX软件从其上市条件分析,是以公司连续3年累计净利润达到3000万元,3年累计经营活动净流量超过5000万元为基础申报上市。公司财务指标达到要求,但却在上 XX software from it
2008将是不平凡的一年,为讴歌盛世,推举新人,河北邢台市作家协会特联合有关单位隆重推出本届大赛,欢迎各界人士踊跃赐稿(前800名参赛者均赠精美贺卡):一、征稿时间:2008年1月
2008年9月17日,第十三届残奥会在北京胜利闭幕。当晚,盛大的闭幕式在鸟巢拉开帷幕,整个闭幕式以“给未来的信”为主题,用一封书信把北京和世界、现实和未来、观众和运动员、