基于GEP和模糊系统的混合模型在分类规则挖掘中的应用

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:mbc3204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门多个学科交叉而形成的新兴研究领域,是对传统数据分析方法的扩充与发展。数据挖掘技术领域已逐渐建立起一套系统的理论和成熟的方法,以关联规则挖掘、分类规则挖掘、聚类规则挖掘为主要形式,涉及机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等多个领域。其应用范围也从最初的商业应用逐渐扩展到医疗、金融、生物、电信、军事、体育等诸多方面。 分类作为数据挖掘的重要任务之一,已经提出了以信息论为基础的决策树方法、以概率论为基础的贝叶斯方法,以神经科学为基础的神经网络方法等等,这些算法基本上都是确定性算法。随着信息技术和计算智能的发展,模糊逻辑、遗传算法和神经网络等软计算技术大量的应用到分类规则挖掘中。软计算并不追求问题的精确解,而允许存在不精确性和不确定性,得到的是精确或不精确问题的近似解,也是人脑求解问题特征的体现。 由创始人Zadeh提出的模糊理论模拟人类所特有的模糊逻辑思维功能,成为描述和处理事物的模糊性和系统中不确定性的一种强有力工具。从而使模糊集分类成为分类规则挖掘的一个重要分支。 模糊系统是基于模糊逻辑的系统,其中模糊逻辑既可作为表示不同形式的系统知识的基础,又可用来构造系统变量间的关系。一般的模糊系统是一种基于知识或基于规则的系统。它的核心就是由IF-THEN规则所组成的知识库。一个模糊的IF-THEN规则就是一个用连续隶属度函数对所描述的某些句子所做的IF-THEN形式的陈述。模糊系统可以看作为一种有效的分类系统。 遗传算法及其它的分支算法遵循自然界优胜劣汰的原则。在模糊系统的建立方面,它们表现出比传统数学方法更为明显的优势,能使模糊系统(或其中一部分)自动生成而不用依靠大量的专家知识。 基因表达式编程(Gene Expression Programming,GEP)是葡萄牙科学家C.Ferreira发明的一种新型的遗传算法。基因表达式编程结合了遗传算法和遗传程序设计的优点,克服了它们的不足,拥有了更快更好的运行效率和结果。 传统的模糊系统建立只是利用了专家知识,当专家知识缺乏或大量数据需要处理和分析时,单纯的基于知识的设计过程有其局限性,缺乏一定的学习能力。遗传算法因其高效性和智能性,在模糊系统的设计中表现出了优越的性能。本文以基因表达式编程和模糊系统为主要研究对象,研究利用二者的混合模型进行模糊分类规则挖掘的方法。在第一章介绍了论文的选题及其研究意义、选题的国内外研究现状及研究的主要内容;第二章简单概述了数据挖掘技术,具体介绍了分类规则挖掘,讨论了现有分类挖掘的基本方法、存在的不足和需要解决的问题;第三章对遗传算法的基本思想、特点以及在机器学习中的应用方法做了概述,并简要介绍了由遗传算法发展而来的遗传程序设计,最后着重讨论了基因表达式编程的技术核心、遗传操作和算法流程;第四章主要是对模糊系统的理论基础——模糊理论进行了介绍;第五章介绍了模糊系统及其理论,详细讨论了遗传模糊系统的基础知识,并且分析比较了它的不同学习方法;第六章将前几章所讨论的理论知识和研究方法相结合,提出了两个基于GEP和模糊分类系统的混合模型,并在其中一个模型中引入协同进化思想,利用基本遗传算法和GEP的两个不同种群协同生成一个基于规则的遗传模糊系统,对两个模型在分类问题上的性能进行了比较,分析了实验结果。本文通过分析遗传算法在模糊分类规则挖掘中的应用特点,利用GEP技术和协同进化等思想,研究分析模糊系统建模本身的难点,提出了有效、灵活的、可理解的模糊分类系统。解决了三个关键问题:(1)将遗传算法及其分支基因表达式编程应用到模糊系统的建立中,从而加强模糊系统的学习能力,获得分类精度更高的模糊规则集。(2)利用GEP如何提取模糊规则,解决在规则学习中产生的规则不一致和规则冗余问题,提高学习效率。(3)如何采用协同进化的思想生成新的模糊系统,保持系统的精确性和可解释性的平衡。
其他文献
“软件产品线”是一个以软件工程学为基础发展起来的新兴多学科交叉的研究领域,现己成为软件工程和软件复用领域研究与实践的前沿。 在产品线工程中,构件之间严格的接口约束
函数优化问题的研究是近年来智能计算领域研究较多的一个方向,求解连续函数优化问题在实际生产生活中有着十分重要的意义,目前已有很多种解决该问题的优化算法。然而在实际的连
命题逻辑以简单命题为最小单位,研究由简单命题和联结词构成的复合命题的逻辑性质以及关于复合命题之间的推理关系。命题逻辑中有很多个形式推理系统,本文讨论的形式推理系统是
关系推断是指利用知识图谱现有的实体间关系推断或推理实体间隐含的关系。尽管现有知识图谱存储着上百万关系类型、上千万实体,他们都存在关系缺失和覆盖率不全的问题。而由于
文档管理是一个研究比较成熟的课题,在网络协同服务环境下,文档管理被赋予了新的意义,本文分析在此特定环境下的文档管理特点,设计并开发了一套文档管理系统。 本课题源自网络
计算机技术在地质制图上的应用,已成为地质制图的一个发展方向和工作平台。随着计算机地质制图技术的迅速发展和广泛应用,地质制图实现了一场很大的革命。 目前我国计算机制
道路设计规划是一项涉及多个专业的综合性工作,设计人员需要对地形,地质,水文等自然环境进行综合分析,以便设计出满足环境、经济、技术等各方面要求的道路。传统的设计方法是用平
地理信息系统发展的几十年来,得到了越来越广泛的应用,逐渐成为计算机科学、地理学、测量与遥感、制图学等多学科综合发展的产物。我国与世界上的一些先进国家相比,在空间信息资
当前IP网络因宽带化、多媒体化要求,迫切需要一种技术解决服务质量和支持新型增值业务。多协议标签交换(MPLS)技术综合利用网络核心的交换技术和网络边缘的IP路由技术的优点,成
2D图形引擎作为2D游戏引擎中最重要的一个模块,对2D游戏引擎的开发来说是至关重要,图形引擎的功能就是负责游戏画面的实时渲染操作,它的强大与否直接决定着最终的输出质量,因此可