基于关联规则的数据挖掘算法的研究

来源 :东北大学 | 被引量 : 2次 | 上传用户:ig226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代智能系统的发展以及海量数据的积累,人们也开始逐渐重视数据挖掘。数据挖掘的其中一个重要研究热点是关联规则的挖掘,其目的是把所有的频繁项集从数据库中找到,从而发掘出存在于数据库中各项目之间可能的潜在关系。由于数据库的不断发展,已存在的关联规则挖掘算法却适应不了这些变化,所以有义务研究挖掘效率更高的算法。本课题通过系统分析关联规则的数据挖掘算法,以现有研究为基础,提出三个不同的改进算法,本课题完成的主要内容如下:(1)简单介绍了关联规则有关的基本概念、性质、分类以及常用的挖掘算法等,深入分析了常用的关联规则数据挖掘算法,包括Apriori算法和FP-growth算法,指出算法所存在的不足。(2)针对FP-growth算法的不足提出了基于节点列表的改进算法PPV,PPV算法构建出名为PPC-tree的频繁模式树结构,遍历PPC-tree结构找出每个节点的节点列表,利用节点列表进行关联规则的数据挖掘。实验证明改进算法在挖掘稀疏型数据的关联规则上表现出良好的性能。(3)为解决PPV算法挖掘密集型数据效率不高的问题,深入分析FP-growth算法后提出了基于节点集的改进算法FIN,并构建出POC-tree树形结构,遍历POC-tree后找出各节点的节点集,对节点集进行关联规则的挖掘。实验证明改进算法对挖掘密集型数据的关联规则具有较好性能。(4)为解决关联规则频繁项集的更新问题,在深入研究了增量式更新算法FUP后,提出了改进的增量式更新算法IFUP,IFUP充分利用了已得到的挖掘结果,有效地解决了关联规则频繁项集的更新问题,实验结果表明改进算法IFUP性能上优于FUP算法。
其他文献
稳定匹配问题在1962年由诺贝尔奖获得者埃尔文·罗斯(Alvin Roth)和罗伊德·沙普利(Lloyd Shapley)提出。匹配问题是将一组对象与另外一组对象进行匹配,在匹配的过程中受到偏
对网络实体的身份进行认证是维护安全网络服务环境的第一道防线。当前,网络技术和应用快速发展带来的一个新情况是:现如今的用户可能需要越来越频繁地在短时间内访问多个服务
关于单边和非互惠制是否成功地促进了发展中国家的出口,在相关文献中存在很大的分歧。本文评估了《非洲增长与机遇法案》(AGOA)的有效性,该法案是一个发达国家(美国)单边和非
针对传统监测系统的局限性和迟滞性,本文研究并设计了全方位、高精度、高实时性的印刷机在线监测系统。在分析凹版印刷机的结构基础上,根据凹版印刷机的印辊,墨辊结构,给出在线监测系统的硬件设计结构方案。系统硬件使用WinCE7系统的嵌入式触摸屏和工业相机作为主体,又用到交换机、开关电源、接近开关、光电编码器等部件。通过对设计要求的分析,选择安全可靠且适当的硬件。论文根据通信理论研究了更高效可靠的千兆网Gi
针对目前温度传感器无法直接对真空烧结炉的内部高温区进行测量,导致在实际生产中无法对真空烧结炉内部的温度精确掌控。而真空烧结炉的温度变化对烧结材料的品质又至关重要,因此对真空烧结炉的内部温度进行精确掌控,不仅能对烧结产品的质量有所保障,也能控制在烧成过程中的不定性因素并及时进行调整,以保证烧结过程的正常运行,针对此问题本文提出基于机理和数据驱动混合建模的方法对真空烧结炉的温度进行软测量研究。随着软测
股利政策作为企业一项重要的财务政策,其核心就是要处理好股利支付与企业未来发展之间的关系,与企业的生存前景及股东利益紧密相连。较好的股利分配政策不仅能够为公司长期发展解决盈余资金的分配问题,而且能够为公司在投资者心中树立良好形象,赢得潜在的投资机会,实现公司价值最大化。然而上市公司、投资者和股票市场监管者之间有效制衡机制的缺失,使得上市公司存在着股利政策不匹配、分配过程不稳定、股利支付率低、支付方式
随着信息物理系统、大数据与物联网的迅猛发展,智能制造已成为未来制造业的发展方向,这对车间协同资源响应的敏捷性、管控决策的准确性等方面提出了更高的要求。在此背景下,
1.1.研究目的1)检测胃癌细胞中SLC15A1基因在m RNA及PEPT1蛋白水平的表达情况。2)通过检测胃癌和胃息肉患者外周血中的PEPT1的浓度,探讨PEPT1是否可以作为鉴别胃癌和胃息肉的分子标志物。3)通过研究SLC15A1基因在胃癌细胞生长增殖过程中的作用,初步探讨SLC15A1基因在胃癌发生发展中的作用及机制。1.2.研究方法第一部分内容初步确定了SLC15A1基因在胃癌细胞中的表达
银行独立保函有高效性和单据性的特点,形成具有自身特色的担保方式,在国际担保业务中很受欢迎。银行独立保函中的开立人不必卷入基础交易合同纠纷,同时受益人能够快速得到赔付,这种担保方式更能适应国际经济贸易的飞速发展需求。银行独立保函便利受益人的特征为受益人提供了一种更加高效的担保方式,但其也隐藏着许多法律风险,加大了受益人不当索赔的可能性,增加了申请人和银行利益受损的风险,我们有必要研究如何防范银行独立
液晶方程是从研究液晶动力学中提出的方程。液晶是既具有晶体各向异性又具有液体流动性的物质,如显示器,因此研究液晶流是很有意义的。但是,液晶方程是Navier-Stokes方程与调