极大布尔关联规则生成算法的研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:zhujie18604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是指从大量结构化和非结构化的数据中提取有用的信息和知识的过程,数据挖掘的研究已经取得了重大的进展,而且被应用到众多的领域。关联规则是数据挖掘研究中一个重要的研究课题,它主要用于发现隐藏在大型数据集中的令人感兴趣的联系。本文首先介绍了数据挖掘的发展概况和应用前景,然后通过研究关联规则的挖掘现状发现,大部分关联规则挖掘的研究重点都放在如何提高挖掘频繁项集或生成关联规则的算法效率上。在实践中,由频繁项集生成的关联规则可能有很多,这将导致用户无法高效地从关联规则中提取有用的信息。本文重点研究了如何在不丢失关联规则信息的基础上减少关联规则的生成数量,主要工作包括以下几个方面:1.通过研究发现以往的关联规则挖掘算法如GRSET算法往往会产生“规则爆炸”的问题,由某个频繁项集生成的关联规则的数量可以在不丢失任何规则信息的情况下被减少。在综合借鉴前人研究成果的基础上本文提出的GLMBR算法深度优先生成了任一个频繁项集所对应的局部极大布尔关联规则LMBR,然后分别在理论和实验两个方面对比分析了用GRSET算法和GLMBR算法生成的同一个频繁项集对应的关联规则集,通过实验验证了GLMBR算法的有效性;2.通过深入研究频繁闭项集、频繁基项集和极大布尔关联规则的性质以及它们之间的联系,提出了基于以上两种特殊项集的极大布尔关联规则的挖掘算法,从理论上进行了论证,用实例进行了验证。
其他文献
当前针对ARP攻击的主要防御措施是采用双向绑定和运行ARP防火墙系统,但是这些措施都存在缺陷。双向绑定需要用户掌握一定的网络管理知识,并且配置过程繁琐,需要对客户主机和网关
第三代合作伙伴计划通过引入飞蜂窝系统,解决LTE-A宏蜂窝系统中室内无线信号强度弱与覆盖范围不足的问题。LTE-A飞蜂窝系统由“宏小区”和“飞小区”组成,通过小区间的切换和接
随着人们生活水平的不断提高,对自身健康越来越关注,社区卫生服务这种新的医疗卫生服务模式逐步取代了以往单一的就医问药方式,大量的分布式社区健康信息的处理和共享是社区卫生
高山出好茶,均福献名茶。均福云雾茶,就创新于兴国县均福山林场。她以“条形秀丽,香气耐人,滋醇味厚,形美色佳”,盈得了广大顾客的赞赏和好评,并获得了一九八五年省、地、地
基于用户会话的测试技术主要依赖于收集的用户会话数据集:数据的数量越多,测试能力就越强。但是随着数据量地递增,用于分析、存储这些用户会话的成本也会迅速地增加。因而,需
无线Mesh网络(Wireless Mesh Network,简称WMN),是一种新型的无线通信网络。无线Mesh网具有自组织性和自愈的特点,是一种多跳的宽带无线网络结构,也是一种高容量、高速率的分
本文对高校计算机排调课问题进行了详细分析,并对排课问题的多目标进行了详细的描述且加以量化;结合UML分析方法对排课需求进行数据库建模;通过分析遗传算法和模拟退火算法,
用例对遗留系统的理解、维护、移植和再工程有重要意义。目前,遗留系统用例挖掘的研究主要是通过检查和分析面向对象系统的代码来实现。但是许多遗留系统是在面向对象的设计
本研究对亚×比异源四倍体种子及植株各器官的色素腺体密度、大小和棉酚含量进行了观察和测定,对亚×比异源四倍体幼苗进行了腺体发生和棉酚含量的动态研究。从生化角度进一
教育信息化是以现代信息技术为基础的新教育体系,在“虚拟”的数字化校园中,依托丰富的网络信息资源,通过信息管理软件系统可以提高教学管理水平。 实验教学则是高职院校教学