多分类器动态集成技术研究

来源 :江苏大学 | 被引量 : 13次 | 上传用户:huangqianqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类所关心的一个根本问题是如何有效地提高分类系统的泛化能力。尽管传统的分类技术在一些领域已经得到了成功应用,其泛化能力也得到一定程度的认可,但是随着时代的进步和科学技术的不断发展,人们对其技术成果有了更高的要求,这就意味着需要开发新的有效技术来满足人们深层次的需求。多分类器集成技术就是在这样的背景下产生的,它通过集成多个满足一定条件的学习个体来达到有效改善分类系统泛化能力和鲁棒性的目的。分类器集成已成为机器学习和数据挖掘等领域的一个研究热点,其研究人员众多,成果亦层出不穷。论文比较全面地介绍了分类器集成的研究现状、工作原理以及常见方法。重点探讨了多分类器集成的一个重要分支—多分类器动态集成技术,并就当前多分类器动态集成方法所存在的一些不足,提出了相应的解决方案,有效地改善了集成系统的分类性能。论文的主要研究成果包括以下几个方面:1、系统介绍了多分类器集成技术的发展现状、相关概念和工作机制。详细讨论了三种经典的多分类器集成方法。2、探究了多分类器动态集成技术的基本原理。总结了动态集成的基本框架。对当前常见的动态集成方法进行了分类整理,并概要地归纳了这些动态方法存在的主要不足。3、针对动态集成方法在训练样本不足情形下对基分类器的“局部分类性能”评估不可靠的问题,将交叉验证技术引入到动态集成过程,提出一类基于交叉验证的动态加权集成方法,具体包括四种方法,分别为DWEC-CV-KOLP、DWEC-CV-KLCP、DWEC-CV-OLA、DWEC-CV-LCA。利用UCI数据库中的小规模数据集对提出的四种方法进行了实验验证。实验结果表明,同一些经典的集成方法相比,当训练集规模不是很大时,提出的方法可以获得更好的分类效果。4、为了消除待测样本邻域中“假邻居”样本对基分类器局部性能分析造成的干扰,在构造邻域的过程中引入了“多分类器行为”信息,提出了一种基于多分类器行为的动态加权集成方法DWEC-CV-MCB。实验表明,改进后的方法不仅可以获得较优良的分类性能,同时可以降低人工选定参数K带来的风险和代价。5、研究了如何利用动态集成技术来提高分类系统的增量分类能力。针对增量式集成算法Learn++的两点不足,提出了一种基于动态选择的增量式集成算法,改善了分类系统的增量学习效果和泛化性能。
其他文献
Internet取得了巨大的成功,它上面运行的TCP/IP协议已成为互连网络的事实标准。随着科学技术的发展,各种新型网络开始出现,例如传感器网络,深空通信网络等,这些网络以很高的链路延
概念格理论,亦称形式概念分析,是德国数学家R.Wille于1982年提出的一种用于概念发现、排序和显示的数据分析方法。概念格理论作为有效的、具有极大潜力的知识发现工具,备受人工
高级程序设计语言可以通过编译和解释两种方式转换成可以在目标机上执行的低级语言。由于解释程序的工作方式效率较低,在实际应用中通常的做法是编译执行,因此,多数高校开设了《
布局问题广泛存在于多种生产实践领域,诸如卫星舱布置、服装裁剪、板材下料和电子线路设计等领域,其研究具有理论价值和实际应用价值。Packing和Nesting问题,又称为装填问题
随着中国铁路事业的飞速发展,对列控系统安全性的要求也越来越高。列控系统的通信安全直接影响到列车的运行效率和行车安全。作为达到安全完整性等级4的通信协议,Subset098安
随着互联网技术的发展,图像数据越来越庞大,如何高效的处理和利用这些图像数据成为了图像处理领域的重要课题。作为图像处理领域的分支,图像分类技术由于在各个领域都有重要
呼叫中心利用CTI技术,将通信网络和计算机网络的多项功能融合在一起,形成一个完整的综合信息服务系统。随着计算机和信息技术的飞速发展,呼叫中心在现在各企业中的应用也越来越
MPLS是一种利用多协议标签交换来进行快速数据包交换和路由的体系,它为网络数据流量提供了目标、路由、转发和交换等能力。它提供了一种独特的方式:将IP地址映射成为简单的具
互联网的迅速发展,移动存储设备的普及,给人们的生活带来了越来越多的便利。然而,未经版权所有人的许可对数字产品的非法复制、修改等盗版行为也日趋严重。因此,版权保护等信息安
目前,信息系统之间难以进行有效地互联、互通和互操作,数据和信息共享存在壁垒,面对日益严重的“信息孤岛”现象,系统集成是必由之路。系统集成需求和运行环境的动态多变,对其提出