频繁闭项集的挖掘算法及内容分析

来源 :河南大学 | 被引量 : 0次 | 上传用户:ontheroad2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是指从大量的结构化和非结构化的数据中提取有用的、有意义的信息和知识的过程。随着数据挖掘研究的不断深入和发展,数据挖掘已经广泛应用到多种领域中。关联规则是数据挖掘研究中一个较早的、有意义的研究课题,它主要用于发现隐藏在大型数据库集中的令人感兴趣的、隐含的、事务之间的联系。在关联规则的产生过程中,频繁模式的挖掘是产生关联规则的第一步,如何有效的挖掘频繁模式一直以来就是研究关注的热点。在大型数据库中,虽然利用有效的算法能有效的提高频繁模式挖掘的效率,但是随着支持度的降底频繁模式的产生数量会逐渐增大,其中有些频繁模式对用户来说可能是毫无用处的,不能为自己的下一步工作提供有效的信息。本文研究的内容主要包括以下几个方面:1.深入研究两种不同策略的频繁模式挖掘方法,广度优先搜索策略和深度优先搜索策略。在参考频繁闭项集挖掘算法Closet、Closet+和FP-Close的基础上,设计了基于被约束子树的频繁闭项集挖掘算法FP-FCI,该算法是一个深度优先算法。从算法分析和实验比较显示:对于密集型数据,FP-FCI算法在时间和空间开销上均有不同程度的提高。2.在挖掘的频繁闭项集的基础上,对频繁闭项集的内容进行分析说明,并设计了频繁闭项集相关联的事务的提取方法和相似频繁闭项集的研究算法——AFHC算法。
其他文献
统计诊断是最近二十多年迅速发展起来的一门统计学新分支,它以强烈的应用背景,新颖的统计思想,广泛的研究内容和丰富的实际成果开创了统计学中一个理论与应用紧密结合的新领域。
五丰优T025在郴州平丘区作晚稻栽培或在较高海拔地区作中稻栽培,表现生育期适中,穗大粒多,产量高,抗性好,适应性广。总结了其高产栽培技术。 Wufengyou T025 in Chenzhou Pi
本文将主要围绕辫子交叉(张量)范畴的构造、辫子张量范畴中的李结构、微积分理论以及乘子Hopf代数中的余表示理论等展开讨论,具体可分为以下五章:   第一章,简要介绍辫子(
微分方程在实际问题中的应用十分广泛,如:在金融学、神经网络、化学等领域都有着重要的作用。20世纪以来,随着大量的应用问题诸如流体力学、气象学、地下水动力学等等的产生和
胡锦涛同志最近指出:要把树立正确的政绩观作为新时期党的建设新的伟大工程的重要内容,通过加强思想政治建设和深化干部人事制度改革予以切实保证。树立正确的政绩观,要靠领
学位
近年来,新华北路街道党工委以争创自治区党委组织部发起的“六个好”创建活动为契机,从阵地、队伍、网络三个环节入手,巩固基层党建基础,促使街道、社区建设事业生机勃勃。
鹤壁中泰矿业有限公司(原四矿)是设计年产量为120万t原煤的高瓦斯矿井,为保证矿井瓦斯排放量及矿井的正常、安全生产,设计建造了通风机房2个,即贾吕寨和赵荒通风机房。 Hebi
学位
北方铜业股份有限公司铜矿峪矿目前年处理矿量400万t,二期工程建成之后,年处理矿量将达到600万t。溜破系统是二期工程的重要组成部分,溜破系统衬板主要用于溜井加固,满足了溜