数据流闭频繁模式挖掘算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:gmn10021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于数据流的流动性、无限增长的特点,传统的数据管理技术已经无法有效的管理数据流中的数据,因此,有必要对数据流管理中的一些新技术做些研究。整个数据库界已经开始关注数据流管理技术。   自动控制、计算机、图形图像、网络等多个领域的知识都涉及到系统仿真技术。数据挖掘技术可以获取仿真数据中隐藏的知识。仿真系统复杂程度越高和规模越大,仿真时间会越长,需要的空间也越大。可见,仿真数据具有数据流的特征,可以用数据流挖掘技术处理仿真数据。关联规则是仿真系统常选择的一类挖掘任务。研究生阶段,本人主要研究了频繁模式在数据流中的应用。其中,重点研究如何在数据流上挖掘闭频繁集。   本文提出了一种挖掘数据流时间窗口中闭频繁项集的方法NEWT-Moment。在单遍扫描数据流各事务的情况下,该方法能完整地记录模式信息。同时,NEWT—Moment提出的减枝方法能很好地降低滑动窗口树F—tree的空间复杂度与闭频繁模式树NEWT-tree的维护代价。此外,该方法提出的时间衰减机制能区分历史和最新模式对挖掘结果的影响。另外,NEWT—tree直接存储闭频繁项集,可随时快速读取闭频繁项集。和T—moment算法相比,算法不需要删除历史数据,不需要记录事务时标,不需要标记各节点,在一定程度上,可降低算法的时间和空间复杂度。大量实验结果表明,NEWT—Moment有很好的效率和准确性。  
其他文献
电视法制节目是中国电视节目体系中最重要的节目类型之一。据统计,目前经广电总局批准开办的电视法制频道共有9套,广播电视法制栏目超过200个。特别是已经形成了一批深受观众欢迎的名牌节目,如中央电视台的《今日说法》、《法治在线》,北京电视台的《法治进行时》等。近年来的各种收视率调查数据都表明,电视法制节目在收视率排行榜上名列前茅,优秀法制节目的收视率更是经常雄踞同一时段节目收视率榜首。    一、电视法
乍一看这两个词组,似乎同出一辙,两者都是新闻,并且都有娱乐二字.但经仔细推敲,还是不难发现两者有不同之处.娱乐新闻主体在于新闻,有如体育新闻,社会新闻等,而新闻的娱乐化
在丰富的创业投资运行机制库中,辛迪加投资是国内外创业投资家普遍采用的机制之一。创业投资辛迪加是一种基于分工和协作建立起来的组织,它介于市场和层级组织之间,延伸了创业投
小学优秀传统文化体验教育的内涵由其教育对象、教育内容、教育方式的特点所规定,在小学开展优秀传统文化体验教育其价值定位主要体现在满足国家发展需求、教育自身发展的需
实践教学是思政课教学的重要组成部分.研究者通过问卷、访谈等方式了解思政课实践教学的现状、存在的问题以及根据研究者所在学校的情况,提出要不断更新教师观念,开辟多种实
随着现代社会的不断发展,人类已经无法离开电源的使用.电源的电动势和内阻是衡量电源性能的一个重要指标.《测定电源的电动势和内电阻》是高考考纲要求的实验,更是历年高考的
本文通过分析咸阳市2015、2016和2017三年的中考试题,总结出人教版初中生物七年级上册的知识点,列出了人教版初中生物课本中没有提到的知识点.预测了2018年的出题思路.此举旨
二手房相较于一手房来说有很多优势。虽然我国的二手房市场起步较晚,但是近年来,凭着价位合理、位置优越等优势,二手房交易市场非常火热。尤其是2009年的营业税优惠政策的实
七叶树的繁殖由于七叶树枝条扦插成活率不高,很少采用扦插繁殖。七叶树成龄树坐果率低,种子易失水丧失发芽力,采用播种育苗时应特别重视种子处理、贮藏和播种等技术环节。1.
论文在分析新时期交通发展所面临形势的基础上,对综合交通规划的体系框架进行了系统、全面的介绍,并以Z市“十二五”综合交通规划为案例,介绍了相关理论和分析方法在实践中的应