基于差异性的多分类器集成方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:dtmark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类所关心的一个根本问题是如何有效地提高分类系统的泛化能力。尽管传统的分类技术在一些领域己经得到了成功应用,其泛化能力也得到一定程度的认可,但是随着时代的进步和科学技术的不断发展,人们对其技术成果有了更高的要求,这就意味着需要开发新的有效技术来满足人们深层次的需求。多分类器集成技术就是在这样的背景下产生的,它通过集成多个满足一定条件的学习个体来达到有效改善分类系统泛化能力和鲁棒性的目的。分类器集成已民成为机器学习和数据挖掘等领域的一个研究热点,其研究人员众多,成果亦层出不穷。   分类器集成技术之所以有效,参与集成的基分类器除了需要具有准确性以外,还需要具有一定的差异性,分类器的差异性反映了基分类器之间的关系,使集成系统能够利用不同分类器之间的互补信息。论文围绕分类器差异性度量的定义和分类器差异性与准确性之间所存在的关系,对分类器差异性度量和集成方法进行了研究。   论文的主要工作包括:   (1)简单介绍了多分类器集成技术的发展现状、相关概念和工作机制,总结了几种不同集成方法的框架,对当前常见的集成方法进行了分类整理,概要归纳了这些方法所存在的主要不足。   (2)总结了现有分类器差异性的定义,在互信息差异性的基础上提出了一种新的差异性度量方法MCC,该方法均衡了个体分类器的准确性与参与集成系统中其他分类器之间的差异性,一定程度上解决了集成算法中所出现的“差异性.准确性”矛盾,有利于集成系统的构建。   (3)在MCC的基础上提出了一种多分类器选择集成算法MCC_DSE、MCC_SSE。算法计算并将具有最大MCC的分类器加入到集成系统中。实验表明,算法MCC_DSE、MCC_SSE具有较好的泛化能力。   (4)在MCC的基础上提出了一种分类器聚类集成算法——MCC-Means,该算法通过K-Means聚类,利用各分类器簇的中心分类器组成集成系统,实验表明,相比于Adaboost.M1算法和bagging算法,MCC-Means具有更好的性能。
其他文献
数字博物馆是文化遗产传承与弘扬的重要依托,目前很多博物馆已经获取了大量的三维数字化文物模型,未来三维模型数量还会加速增加。而如何将这些几何性质复杂、细节程度高的文
随着全球经济一体化的加速,信息技术的发展,市场竞争的日益激烈和市场需求的快速多变都给企业带来了难得的机遇和严峻的挑战,这就要求企业应该具备对不断变化的市场需求做出
近年来,图像融合已经成为图像处理和计算机视觉领域中一项重要的技术。所谓图像融合是指将多源信道上得到的多幅关于同一对象或区域的图像数据,利用图像处理及相关的计算机视
转炉炼钢在钢铁工业中占有重要地位,其生产过程的主要任务是冶炼出成分和温度均合格的钢水。由于在目前技术条件下,钢水成分和温度的检测不能连续进行,且影响因素较多,冶炼过
随着入侵检测技术的不断发展,出现了众多的入侵检测系统,因此对各种入侵检测系统的功能和性能评估形成了需求。在需求的推动下,对于IDS的测试也在不断的发展。本文在对已有的入
线描图是用单色线描绘物体的一种绘画。而浮雕,则是在平面上雕刻出凹凸起伏形象的一种雕塑,是介于圆雕和绘画之间的艺术表现形式。浮雕历史悠久,流传广泛。从原始社会的岩画
分布式虚拟环境是一种基于虚拟现实技术与网络技术的实时网络交互环境,是研究支持分散在不同地点上的多个用户,基于网络在共享的、统一的虚拟环境中,通过分布式协作和交互完
随着信息技术的普及和电子商务的不断发展,物流不但实现了由传统向现代的快速转型,更被提到了前所未有的高度,在经济发展中的重要作用和战略地位也越来越突出。将信息技术、
随着微机电系统、计算机技术和通信技术的快速发展,出现了一种新型的网络系统,即无线传感器网络。由于其具有单个节点成本低廉、功耗开销小以及节点布置方式简单等优势,在诸
是交通运输业的永恒主题。近年来,随着道路汽车数量的急速增长,交通事故的发生率也越来越高,给人类社会带来日益严重的的危害。在这严峻的环境下,疲劳驾驶检测技术受到了最为