基于约束的最大频繁项目集挖掘算法与实现

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:yue_pan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库技术的逐渐成熟及网络技术的迅速普及,使人们采集数据的能力得到了极大的提高,从而导致了全球范围内数据存储量的急剧增大。“数据爆炸与知识贫乏”是信息时代所面临的一个严峻的问题,而数据挖掘就是解决该问题的有效手段之一。数据挖掘是从大规模的数据量中获取有用信息,发现隐含的、先前未知的、对决策有潜在价值的知识,因此对数据挖掘技术的研究有着重要的意义。本文以数据挖掘中一个重要的领域关联规则挖掘为研究课题,并对关联规则的挖掘方法进行了研究和分析。本文的研究工作主要包括以下两个方面:一方面,提出了基于数据库变化的关联规则增量式更新算法。发现频繁项目集是关联规则数据挖掘中的关键问题,频繁项目集是在给定的数据库里,在满足最小支持度和最小置信度下的一个项目集合。但随着数据库发生变化,就会产生不同的频繁项目集,如何发现在数据库变化情况下,利用已挖掘的频繁项目集来实现更新挖掘就是需研究的问题。另一方面,提出了基于约束的最大频繁项集挖掘算法,该算法是将约束条件应用到挖掘算法中,减少候选项目集的个数,提高算法的执行效率。对算法进行了详细的分析。实验结果表明,该算法具有较好的可操作性,并在一定程度上解决了产生许多无关或无价值的关联规则。
其他文献
传统的分组密码分析技术局限于算法的数学结构,其攻击效果往往不佳。国内外密码学界都在加强基于算法实现的分析方法研究,边带信道分析技术作为一种新的密码分析方法迅速成为
在实际生产过程中,复杂不确定性系统内部关系复杂、外部影响因素多、数据量大较难建立简单函数方程来预测系统的未来发展趋势,制约了人们获取有用信息,采取有效行动的能动性
由于应用的复杂性,在很多情况下单个Web服务难以满足实际需求,对于复杂业务过程的处理需要采用服务组合的方法即由各个小粒度的Web服务相互之间通信和协作来实现大粒度的服务功
句法分析是自然语言处理中的关键性问题之一,其主要任务是自动识别句子的句法结构。同时句法分析也是中文信息处理领域内的一个重要课题,它的发展能带动其它相关语言学应用的
电力系统的无功优化是在当前电网的结构和运行情况给定时,通过调节一些控制变量,如发电机节点的输出功率,变压器变比,电容器等无功补偿装置的投切参数等,使系统达到网损最小,
目前,基于数据库和联机事务处理(OLTP)的医院管理信息系统(HMIS)的应用已经同趋成熟,并积累了大量的历史数据。但当面对数据量迅速膨胀的超级数据库时,许多企业和信息技术人员却
智能电网大规模事故给人们生活带来了严重后果,经过专家学者对控制系统软件可靠性的研究得出,某些软件可靠性模型在处理软件可靠性评估和故障诊断时无法得到良好的效果,因此如何构建适应智能电网控制系统的软件可靠性模型成为本文研究的核心问题。本文目标是采用基于形式化的软件可靠性模型构建高可靠性的软件运行模式。以现有的电网控制系统软件可靠性研究入手,分析电网及其控制系统特性,把控软件可靠性模型的基本要素,利用形
可扩展标记语言XML已经成为数据交换的重要格式,并且广泛应用在数字图书馆、科学数据库以及互联网等领域。随着XML文档的广泛应用,对于XML文档检索的研究已逐渐成为信息检索领
本文分析了当前多媒体网络教育系统中资源平台和资源库的现状以及存在的一些问题,结合Flash流媒体技术、SOA架构以及J2EE技术,基于当多媒体网络教学系统,提出了一套新型的资
DCS是分散控制系统(Distributed Control System)的简称,它是一个由过程控制级和过程监控级组成的以通信网络为纽带的多级计算机系统。根据DCS网络安全相关规定,DCS不允许直