基于智能算法的正负关联规则挖掘研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:yty3224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对“人们被数据淹没,却饥渴于知识”的挑战,数据挖掘(data mining)和知识发现(knowlegde discovery)应运而生,并得以蓬勃发展。关联规则(association rules)挖掘是数据挖掘众多功能中应用较为广泛,成效较为显著的一种,它最初分析事务数据集中项目之间的联系,后来学者们改进和扩充了问题原型,目前关联规则不仅有理论上还是应用上都比较完善了。在现实中,人们有可能对“购买某物蕴含不购买某物”这样的规则感兴趣,这种类型的规则就是负关联规则,它的重要性等同于正关联规则,负关联规则越来越受研究人员的重视。在挖掘负关联规则时,如果使用传统的衡量标准“支持度-置信度”,会出现大量冗余或错误的规则,所以制定有效的衡量标准在挖掘负关联规则时是至关重要的。   许多数据挖掘的问题可以看作是搜索问题,数据集看作是搜索空间,搜索策略可以用一些智能算法。文化算法、免疫克隆算法作为智能进化算法,具有全局优化搜索能力,其所提供的耐噪性、无监督学习、记忆等进化学习机理提供了新颖的解决问题的方法。由于智能算法具有许多优点,研究人员们在进行关联规则挖掘时使用智能算法搜索频繁项目集,从而提取关联规则。   本文的研究工作主要包括以下几个方面:   (1)分析了正负关联规则的基本概念及挖掘算法,重点研究了挖掘负关联规则时现有的关联规则衡量标准的不足之处,提出了一种新的衡量标准——有效标准,使用该标准可以同时挖掘正负关联规则,剔除无效规则。实验验证了方法的有效性。   (2)构造了一种基于文化算法和免疫克隆算法的正负关联规则挖掘算法,该算法将文化算法和免疫克隆算法相结合,新的衡量标准引入其中,同时得到正负关联规则。实验表明,该算法收敛速度快,并且得到有效的关联规则。   (3)研究了关联规则挖掘系统原型的设计思路、主要功能,并设计了正负关联规则挖掘系统,应用本文算法部分实现了关联规则挖掘系统原型的功能。建立科学的系统结构,利用挖掘算法的重用性和嵌入性,使算法与系统其他模块有机结合。  
其他文献
人工萤火虫群优化算法源于对自然界萤火虫群群体觅食或吸引伴侣行为的模拟,是一种新型群体智能优化算法。与目前出现的群智能算法相比,人工萤火虫群优化算法在计算速度和消耗内
随着互联网技术的发展和普及,人们的生活越来越离不开网络。但网络生活在给人们带来便利的同时,也带来了安全方面的一些威胁,比如网游帐号被盗、QQ号码被盗、甚至网银帐号被盗,而
近年来,随着低功耗、高速率无线通信协议的提出,利用低成本、低功耗及易集成的CMOS工艺实现射频集成电路已成为当前研究的热点。低噪声放大器(LNA)作为射频前端的重要功能单
随着互联网络技术的发展,万维网作为一种新兴的信息媒介已经越来越多的渗入到社会的经济、文化、教育以及娱乐等各个领域,并作为其中的重要组成部分,改变着我们的工作和生活。主
随着分布式应用的发展,基于web服务的分布式模型己成为开放网络环境下一种典型的Internet应用形态。但是由于web服务环境的开放性和欺骗性的特征,为了降低交易风险和保证交易
随着以计算机和网络通信为代表的信息技术的迅猛发展,现代政府部门、军事军工、金融机构和商业组织等对网络安全的要求也越来越高。在当前窃密程序种类千变万化、攻击手段层
ECT/ERT双模态成像技术是一种新型电成像技术,在工业检测中具有广阔的应用前景。目前传统ECT/ERT双模态成像系统中连接数据采集部分和成像终端多采用有线连接的方式,存在电缆
无线Mesh网(以下部分和WMN交替使用),又称无线网格网或无线网状网,是从移动Ad-hoc网中分离出来,同时沿袭了部分WLAN技术的全新的无线网络技术。严格来讲,WMN是一种新型的无线
在社会化标签推荐系统中,标签模糊和冗余的存在不但影响了系统的推荐质量,而且使得标签推荐系统不能得到准确的评估。如果将标签模糊和冗余应用到标签推荐系统当中,就可以提
红松是我国珍贵的树种,其经济效益非常可观。为了更好的保护红松和提高红松球果的产量,应该采用现代化的信息手段对红松的结实量进行预测研究。本文主要研究的是关于红松的球