分类器的选择性集成及其差异性研究

来源 :兰州理工大学 | 被引量 : 14次 | 上传用户:zhenlic0300
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是研究让机器具有学习的能力,集成学习是机器学习的一大研究热点,是将多个不同的单个个体模型组合成一个最终模型,这些模型就是我们所要生成的分类器。生成这些模型的目的是利用这些个体模型,利用他们之间的差异性,来改善模型的泛化性能。近年来分类器选择集成方法的应用越来越广泛,已经深入到很多的领域,比如在语音识别、人脸识别、情感识别、文本分类、数据挖掘、游戏、遥感图像分类、医疗诊断等,在这些方向上受到了广泛应用。分类器集成利用不同分类器之间的互补性,提高集成后分类器的性能,并且在各自分类性能上分类器集成充分发挥了每个成员分类器的优势,得到比单个成员分类器都好的分类识别率,其目的是通过对多个互补的分类器识别结果的集成来得到一个高性能的识别系统。具有很大的研究价值,并且也具有很广的实际应用前景。分类器的差异性和准确性是集成学习的两个充分必要条件,也是选择性集成学习的主要依据,通过提高成员分类器的识别率,增加成员分类器的差异性,来达到提高分类器集成系统性能的目的。但是,在体现分类器的多样性方面分类器集成方法存在着很多不足。为了实现分类器集成系统的最优性能,需要生成具有高准确性和差异性的分类器进行集成,二者必须兼顾,同时也需要考虑针对不同类别的样本采用不同的集成方式。就分类器集成学习中如何提高分类器的准确性,如何提高分类器的差异性这些研究问题进行研究。分析并研究了成员分类器的准确性和差异性的产生,提高集成分类器的识别性能。本文的工作主要是:分别从集成学习的两个阶段(个体分类器的生成阶段和个体分类器的组合阶段)入手,进行了有关集成学习的两个阶段的优化处理,来生成具有高准确率和差异性的分类器。在分类器的生成阶段,为了生成具有准确率较高的分类器,采用了对原始训练数据集进行特征分割的方式,产生较优的分类器,充分考虑训练样本集的分布特征,在保证单个分类器高性能的情况下,达到成员分类器多样性的目的。在分类器的组合阶段,组合这些分类器的分类结果来达到理想的效果,利用合理的差异度量公式选择出具有差异性的分类器,使得分类器的两个必要性都得到保证,得到平衡,有利于提高集成学习的识别性能。
其他文献
随着计算机科学的发展,各行业对软件产品的质量和开发周期提出了更高的要求。面对持续变化的需求,软件本身需要快速地做出响应。建模工具作为软件设计过程中的主要辅助工具,可以
全球经济的发展表明,一个国家的综合实力主要取决于其制造业提供产品和服务的能力。车间是制造企业管理和生产的基础环节,是企业管理与生产制造的结合部位,也是企业信息流与
装配序列规划是产品生产中的一个重要环节,合理的产品装配序列对装配效率的提高、装配成本的降低和装配质量的保证等有重要影响。因此,对装配序列规划的研究具有重要的理论意
建筑物的毁伤效果模拟属于虚拟场景生成的范畴,在游戏娱乐、军事训练、广告与电影制作、旅游等各个领域有着巨大的应用前景。传统的虚拟场景生成方法往往需要对场景进行三维重
统一建模语言(UML)是在多种面向对象建模方法联合的基础上形成的建模语言。它以支持面向对象、可视化建模和强大的表达能力等优点已经被人们广泛的用于多种类型的系统建模。
统计数据表明,我国的餐饮业正处于高速发展时期,与此同时,消费者对餐饮业的服务要求也越来越高,餐饮行业也面临着物价上涨和人力资源成本快速增加的压力。如何提高效率,减少
对业务流程建模是将业务流程计算机化的必要手段,同时工作流建模属于工作流管理系统的三大主要功能,目前已经成为工作流技术的研究热点之一。论文选择在形式化描述和直观图形
随着多媒体技术和计算机网络技术的发展,人们接触到的图像数据以前所未有的速度增长,越来越丰富的图像资源使用户难以在浩如烟海的数据中找到自己真正需要的信息。因此,对图像数
RFID(Radio Frequency Identification)技术是自动识别和数据采集技术的一种,为了在提高产量的同时降低成本,在商业信息化中RFID技术日益兴起,已逐渐深入到各个领域,如供应链
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分的方法,在数据挖掘、统计学、机器学习、空间数据库技术、生物学和市场学等领域有着广泛的应用。聚类算法可以分为基