基于遗传规划的多类分类技术研究

来源 :河北农业大学 | 被引量 : 0次 | 上传用户:y567843241
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题尤其是多类分类问题一直是数据挖掘研究的热点问题。在实际应用中,如图像识别,文本分类等等,需要处理的数据都是海量和多类别的。如何解决多类别的分类问题,是近几年研究的重点之一。本文将新的遗传学习算法——遗传规划(Genetic Programming)用于多类分类问题中,对其算法进行了尝试性地改进。遗传规划是一种新型的搜索寻优方法。它仿效生物界中进化和遗传的过程,遵从“优胜劣汰,适者生存”原则,从一组随机生成的初始可行解开始,通过复制、交叉和变异等遗传操作,逐步迭代而逼近问题的最优解。本文阐述了遗传规划算法的原理和进化计算的基本知识;介绍了相关分类技术;分析了遗传规划的特点;研究了运用遗传规划解决分类问题的方法模型;并针对遗传规划在多类分类问题中的技术局限进行了改进。本文主要从三个方面对基于遗传规划的多类分类技术进行改进。首先在基于静态选择边界模型(Static Range Selection,SRS)的基础上进行改进,建立了两种动态分类模型:基于中心的动态边界选择和基于狭槽的动态边界选择,对这两种模型进行了相应的算法设计。第二,将梯度下降搜索算法引入到遗传规划中。遗传规划整体算法仍然运用全局搜索,只是在确定遗传程序数字终端时运用了梯度下降搜索的方法,不影响遗传规划整体的束搜索和遗传操作。第三,遗传程序在进行遗传操作的过程中,会产生很多冗余。本文提出一种在单个程序进化过程中定期清除冗余的方法。该方法既不影响遗传规划的结构和进化过程,又可以提高精度,加速演变。最后,进行了实验设计,通过五个不同难度的图像数据样本集(Shape,Coin)对以上三方面的改进进行验证。实验结果表明,SRS法在较简单的两类分类问题中效果较好,而基于动态的边界选择模型为解决遗传程序的输出转化为类别标定的分类问题,尤其是较复杂的多类分类问题提供了新的解决方法;梯度下降搜索算法提高了群体的进化速度和学习效率;遗传程序进化过程中定期对终端集进行简化,在一定程度上改善了分类性能。本文在遗传规划技术三个方面的改进不同程度地提高了遗传规划的分类性能,但这仅仅是一个初步的探索,需要进一步研究探讨。
其他文献
XML的全称是eXtensible Markup Language(可扩展标识语言)由于具有简单、可扩展、互操作性强,开放性强等特点,正迅速成为一种与技术无关的数据交换的标准和传输格式。鉴于XML在
产品结构管理技术的发展融合于产品数据管理技术(product data management)的发展之中,产品数据管理技术出现于20世纪80年代初期,从开始的工程图档管理逐渐扩展,迅速成为一门
电力负荷管理系统是运用通信技术、计算机技术、自动控制技术对电力负荷进行监控、管理的综合管理信息系统。随着电力负荷管理系统应用的不断深入,负荷管理具有图形系统、数据
Client/Server结构是近几年非常流行的一种分布式计算模式,它的优势在于广泛地采用了网络技术,将系统中的各部分任务分配给网络中担任不同角色的计算机。然而在分布式环境下,
近年来对网络业务流量的测量和分析表明,网络业务是自相似(分形)的。网络业务的自相似特性对网络的分析、设计、控制和性能评价等均具有重大的影响。本文介绍了自相似的常见
随着计算机网络技术和多媒体技术的发展,流媒体正成为互联网应用的主体,推动了互联网整体架构的革新,拉动信息经济的发展,在互联网媒体传播方面起到了主导的作用。各种多媒体应用
随着网络以及多媒体技术的迅速发展,涌现出了大量的数字视频,如新闻、广告、娱乐节目、个人自制视频等。在快节奏的现代社会里,数字视频的大量涌现引发了一个重要的问题,即如何快
决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其基本思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的决策树,对数据进行预测。决策树的建立过
近年来随着疲劳驾驶导致越来越多的交通事故发生,驾驶疲劳监测已经成为辅助安全驾驶领域的一个重大课题。以往的驾驶疲劳监测研究中,常常通过司机的面部视频信号和脑电、体温等
随着网络技术和多媒体技术的迅速发展,网络音频视频也成为必不可少的内容。于是,流媒体技术应运而生,不仅应用在PC机上,而且也广泛的应用在一些嵌入式设备上。流媒体具有实时