基于计算智能的关联规则挖掘算法研究

被引量 : 0次 | 上传用户:thomas962
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘技术已经引起了信息产业界的广泛关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。对数据挖掘技术进行系统和深入细致的研究是全球信息化发展的客观要求。数据挖掘技术有很多研究领域,其中关联规则就是一个重要的研究方向,在商业决策方面有着极其重要的应用价值。本课题主要对关联规则挖掘进行了相关的研究。根据传统的关联规则挖掘算法,如Apriori算法及其改进算法都是集中在对确定的、精确的概念上进行挖掘的,难以对非精确的或者说模糊的概念进行挖掘。同时通过实验可发现寻找频繁集主要的计算是在生成频繁2-项集上,频繁2-项集生成的过程是Apriori算法挖掘的瓶颈所在,针对这种情况论文提出了一种新的基于模糊集的关联规则挖掘算法,算法引入了模糊集理论和语义关联规则的概念,对数据库的数值属性进行了合理的非精确语义转换,然后通过改进剪枝部分被扫描项集的大小来提高算法的效率,避免了被扫描的集合长度按照指数型增长的趋势。因为Apriori算法的核心问题是发现最大项目集,发现最大项目集的过程就是全局的搜索过程,而遗传算法是一种全局优化算法,它避免了搜索过程中的局部最优。因此将遗传算法用在规则的发现和提取方面能够发现真正有用的规则。由此论文提出了一种基于遗传算法的关联规则的挖掘算法,主要对定量关联规则进行挖掘,算法主要包括关联规则的编码方法设计,适应度函数的构造以及遗传算子的改进等。根据论文所提出和设计的两种基于计算智能的关联规则挖掘算法,我们分别以医疗数据库和学生数据库为挖掘原型来进行关联规则的提取,并进行了实验分析,实验结果验证了两种算法的有效性,也说明了关联规则挖掘广泛的应用前景。
其他文献
血压是反映人体循环系统机能的重要参数。本文研究了一种无创伤连续测量人体动脉血压的方法,通过对脉搏波传播时间的检测来实现血压测量。 本文首先研究了利用脉搏波传播
本学位论文以山东省交通厅科技基金项目“山东高速公路沿线区域地质特征及典型地基土承载力确定研究”为依托,旨在研究对山东省公路地基工程地质特征有一全面的认识,为山东省
后现代哲学解释学认为理解是人存在的方式。人自从呱呱落"地"以后,就不断理解着世界,体现生命和生存的意义,那些看上去很"浅薄的"哲学和科学思想,以及"简单"的艺术手法,无不
河南淅川产的虎晶石猫眼石,由蓝石棉蚀变而成,主要成分为SiO2。由于含Fe、Mg、Al、Ca、K等杂质元素,使其赋色显黄褐色-黑褐色。蓝石棉在蚀变过程中,完全保持了它的纤维状假像
现代化,不仅是当今中国社会发展的主题,而且也是世界大多数国家发展的趋势。中国改革开放的总设计师邓小平,围绕实现中国社会主义现代化的宏伟目标,提出了一系列关于社会主义
本论文基于标准Granger因果检验模型、综合误差矫正模型,先选取单因素模型对我国电力与经济增长的关系在总量、分产业、分部门、分地区、地区分产业进行系统的分析;然后采用
目的探讨自体大隐静脉上肢移植内瘘的临床应用及护理。方法选择2012年8月-2013年4月在某院血液净化中心维持性血液透析的患者10例。这些患者的吻合动脉为上肢肱动脉或桡动脉,
随着自主学习理论在语言学习中的引入, 研究人员开始普遍关注怎样构建适于自主学习的学习环境. 二十世纪九十年代网络教育的兴起为解决这一问题开辟了新的途径. 网络教育的本
目的 :探讨辅酶 Q1 0 对老年冠心病患者自由基的影响。方法 :观测 30例老年冠心病患者辅酶 Q1 0 治疗前、后超氧化物岐化酶 (SOD)和丙二醛 (MDA)含量的变化 ,并与对照组比较
随着我国经济建设的飞速发展以及人民生活水平的不断提高,桥梁工程建筑技术出现了前所未有的崭新发展局面。但是,局部复杂结构的应力分布情况不能通过目前广泛采用的等效梁模