基于改进群体智能算法的数据分类学习模型研究

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:suntiger2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量数据时代,人们对于能够自动地、智能地把数据转化为有用知识的技术有着迫切的需求,这种需求促进了数据挖掘技术的快速发展。数据分类是数据挖掘的一项重要任务,它可以用来挖掘重要数据类的模型以及预测数据的未来趋势。数据分类在人工智能、网络金融、模式识别、机器学习等领域已经展开了广泛的研究,并产生了众多的分类建模算法。虽然数据分类在理论和技术方面己经取得一定的突破,但它仍然存在一些问题,主要包括:分类建模算法的准确性和有效性、分类规则的可理解性等。传统分类建模算法在预测精度、可扩展性、高效性等方面都面临着巨大的挑战。由于数据分类是通过训练集合来构建分类模型,即通过分类算法寻找出最能代表训练数据的分类规则集合,这是一个逐步寻优的过程,因此许多研究者将群体智能算法应用于分类学习模型构建并取得了一些成果。群体智能算法是模拟自然界中种群通过个体之间的相互协作去解决一个复杂问题的过程,该算法具有潜在的并行性和较强的鲁棒性,而且算法不依赖于具体问题。基于群体智能算法的分类学习模型构建已经成为近年来数据挖掘领域的研究热点。本论文将群体智能算法中比较有代表性的蚁群算法和基因表达式编程算法(Gene Expression Programming,GEP)引入数据分类挖掘中,主要对基于传统蚁群分类算法和基本GEP的分类学习模型构建问题进行了研究,分别从不同的角度对这两种算法进行了改进,提出了新型蚁群分类建模算法Ant-MinerPAE和改进的基因表达式编程算法IGEP,并通过多组实验验证了该改进算法在分类学习模型构建上的有效性。本论文的主要研究工作如下:(1)介绍了数据分类问题的定义、原理及实现方法,分析了常见分类建模算法的不足之处,然后研究了蚁群算法的思想来源和核心步骤,深入研究了传统的蚁群分类算法Ant-Miner,并追踪了蚁群分类算法的发展历程。为了避免算法过早收敛陷入局部最优解,提出了一种基于信息素吸引与排斥原则改进的蚁群算法,设计了新的信息素计算方法及概率转移公式,调整了算法迭代的次序,蚂蚁在搜索过程中的信息素既包含吸引部分,又包含排斥部分,该方法可以平衡蚂蚁在构建模型过程中的探索与开发的关系,使得蚂蚁在搜索过程初期倾向于探索,在搜索过程后期倾向于开发。(2)为了证明本论文改进蚁群算法的有效性,将该算法应用于分类问题建模,同时在考虑规则之间相互影响的基础上,提出了一种新型蚁群分类建模算法Ant-MinerPAE,然后利用UCI的12组公共数据集进行了分类实验,将实验结果和其他常见的一些分类挖掘算法如CN2、C4.5rules、PSO/ACO2、Ant-Miner、cAnt-MinerPB等进行了比较。实验结果表明,该算法在预测精度和规则简洁性方面具有一定的优势。(3)深入研究了GEP的思想及基本GEP的缺点,针对基本GEP进行建模时容易受到噪声干扰,导致过早收敛,陷入局部极值等问题,本论文提出了一种改进的GEP算法(IGEP),增加了“基因提取”、“基因翻转”和“基因动态调整”算子,该改进算法可以提高基因的有效利用率,增强进化过程的种群多样性,从而具有更高的收敛速度和求解精度,且能更好地避免早熟现象。(4)为了证明IGEP算法的优势,将IGEP算法用于2015年5月11日至2015年8月5日的全国白萝卜、大葱、冬瓜、茄子、青椒、土豆等蔬菜价格的建模及预测,结合时间序列方法,通过对训练数据进行分析和进化,创建数学模型,实现蔬菜价格的仿真与预测;该实验同时实现了线性回归、抛物线回归和基本GEP算法的仿真与预测,通过多组实验对比证明IGEP算法在蔬菜价格建模及预测上具有更快的收敛速度和更高的精度。(5)基于IGEP算法提出了均衡概率选择和超级函数的策略,使得种群初始化时终结符和函数符被选机会均等,不同目数的函数符被选概率相同,变异算子中的字符与函数的选择概率相等,该策略能够保证种群的多样性,同时超级函数的设置可以使进化跳出局部最优并搜索到更好的解。然后,将改进的GEP算法用于构建分类学习模型,针对乳腺癌、气球、信用卡三个二元分类问题和葡萄酒识别、鸢尾花分类等两个三元分类问题,通过该改进算法进行多组实验,并分别与基本的GEP分类算法及其他分类算法进行对比,结果表明,改进的GEP分类算法在分类预测准确率上有着明显的提升。
其他文献
[摘要]环境这一主题一直是人们关注的焦点。政府法规、消费者偏好以及其他相关利益人等对“绿色”化的产品和服务越来越重视。因此,越来越多的企业在制定决策时,不得不考虑环境这一影响因素。于是在供应链层面上,将“环境”或“绿色”整合到供应链管理的决策和日常运作中去。本文对原有绿色供应链管理决策模型的各个影响因素进行了阐释和分析,并对他们之间的相互关系进行了调整,得出7更加系统、详细的绿色供应链管理决策模型
目的了解新时代大学生、中学生的人格特征,并比较不同学生时期MMPI人格特征的变化,以便对教育培养学生提供科学的参考。方法采用自编学生一般情况调查表和明尼苏达多项个性测验
领导干部形象的塑造有许多内在运行的途径,比如通过正确的理论指导去塑造,通过准确的形象定位去塑造,通过高尚道德品行的充分展示去塑造,通过优良政绩的创造去塑造,通过思想
本实验主要是对延长蛋清肠货架期进行研究。选择二个复合型添加剂配方1号、2号,加在蛋清肠生产过程中,将其产品在贮藏期分别进行微生物、理化、感观指标实验,并与空白样对照,筛选出
在德国刑法学中,客观归属论能妥当地通用于故意犯和过失犯的见解已成为通说。虽然对于导入作为限制结果归责的客观归属论,日本主流意见的态度比较消极,但从一定的规范性基准
高中学生生活满意度不仅关乎学生的身体健康,还影响学生的成长和发展。尤其是近几年全国相对发生较多的关于学生心理健康的问题,比如抑郁、校园欺凌、甚至自杀等事件,这些事
日本传统的相当因果关系理论,在处理行为后介入的事情时,构造上的不明确性、结论上的不妥当性,导致了相当因果关系的危机的产生。目前日本新的相当因果关系理论,重视不同要素
介绍滑坡模型试验在滑坡研究中的现状,包括滑坡现场模型试验、滑坡底摩擦模型试验、滑坡框架式模型试验、滑坡离心模型试验和滑坡综合模型试验在滑坡方面的研究成果以及模拟
在环境美学日益受到关注和重视的今天,景观设计在城市建设中起到了相当重要的作用。随着时代的发展,浮雕艺术已经逐渐渗透到了建筑景观设计之中。作为设计中的一个元素,浮雕
紫草是一种重要的中草药材,其培养细胞在M9培养基中可以大量生产主要的药物成分紫草宁。本文主要论述了在紫草细胞中与紫草宁形成相关的代谢酶和基因方面取得的研究进展,分别