基于典型相关分析与多元化分类器的集成学习研究

来源 :江苏大学 | 被引量 : 1次 | 上传用户:ghj1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉以及计算机图形学研究领域,对自然场景中的事物进行精确的分类识别一直是该领域的研究热点。当前基于单分类器的图像分类结果具有不稳定性且不能平衡局部样本特征与分类器结果之间的关系。针对上述问题,本论文研究利用集成学习的方法来提高分类器分类结果的准确率。本论文通过研究非同质分类器学习方法的优点以及局部样本特征与分类器分类准确率之间的关系,利用典型相关分析的原理权衡局部样本特征在样本分类过程中的作用,并且结合非同质分类器的学习原理的差异性,实现差异化选择集成。本论文主要研究内容如下:(1)分析了本课题研究的背景意义以及现有的集成学习相关算法。本文简要的介绍了集成学习在图像分类识别技术中的重要作用,以及图像分类技术在商业、国防等领域的应用前景。其次介绍了现有的集成学习相关技术以及几种特征提取的方法,以及国内外在集成学习领域的研究现状。随后从逻辑回归方面进行阐述,深入探讨现有的单分类器特点与应用范围。最后介绍了几种应用广泛的多分类器集成方法,Bagging、Adaboost、Random Forest,以及他们的算法流程。(2)提出了基于局部典型相关分析的分类器集成策略。针对传统集成学习模型不能平衡局部样本特征在分类器分类时所起到的作用,不能兼顾局部样本特征与分类器分类结果之间的关系等问题,本论文提出了基于典型相关分析(Canonical Correlation Analysis,CCA)的分类器集成方法。本文通过寻找局部样本特征与分类器输出结果之间的多个典型相关变量,从而发现不同特征集合与最优分类器组合之间的最大关联,并用于集成分类。实验结果证明本论文所提方案在与传统的集成学习方法Adaboost与Majority Voting在UCI,Image Net等多个数据集上的实验结果对比证明本论文所提方法与其他集成学习方法相比能够有效提高集成模型分类准确率。(3)提出了基于局部多元伯努利的差异化分类器集成方法。针对同质分类器分类结果具有偶然性,且单一分类器只对特定样本分类具有敏感性等问题,提出了基于局部多元伯努利的差异化分类器集成方法。首先,本模型应用KNN的思想挑选局部待测样本,用此方法实现动态的调整多类数据集测试时分类器权重。其次,本方案使用待测样本的近邻来计算每个分类器对测试样本检测结果的概率均值,进而得到不同分类器对不同待测样本的敏感性,并以此从局部的方面考虑多分类器的分类能力高低,同时计算各分类器关于不同样本检测时的置信度加权值。最后,利用多元伯努利的思想将多分类器集成融合。在UCI、Image Net数据库中的多个数据集上的实验证明,本论文所提分类器集成方案与传统的分类器集成方法Adaboost、Random Forest相比能够有效提高分类器集成模型的检测准确率。(4)设计了基于局部多元伯努利的差异化多分类器集成的车牌识别原型系统。在上述研究的基础上设计了一套基于局部多元伯努利的差异化多分类器集成的车牌识别原型系统。该系统应用Matlab与Visual C++混合编程,并结合Opencv视觉库协助处理图像。该系统可以实现车牌定位功能、字符分割功能与字符辨别功能,并通过测试进一步说明本系统的可行性。
其他文献
实时数据库是其事务和数据都具有定时特性或显式的定时限制的数据库系统,系统的正确性不仅依赖于逻辑结果,而且还依赖于逻辑结果产生的时间。实时数据库在实时系统中的应用日
当前,随着全球性的市场开放和竞争的日益激烈,电信运营业正面临着巨大的变革,传统的电信网技术正在发生着深刻的变革,通信市场的竞争也愈演愈烈。语音网上基于原电路交换的业
当今社会,E-Learning在远程教育、集团培训、高校教学中扮演着越来越重要的角色。同益扩大的高校规模、分散的校区、电算化教学的开展等都使得现代高校教学越来越倚重于E-Lear
本文以提高入侵检测系统数据处理性能和检测效率的同时尽可能降低系统误报率和漏报率为目的,着重对高效网络入侵检测技术与算法进行深入研究.主要研究内容包括以下几个方面:
作为航空飞行器的动力装置,航空发动机的故障诊断一直以来都是航空发动机可靠性工程中的重要组成部分。然而,由于航空发动机故障诊断的复杂性和困难性,往往需要航空维修专家的参
随着互联网技术的快速发展以及多媒体数据在各行各业应用的爆炸性增长,文本、图像、语音、视频以及3D模型等各种形式的多媒体数据正在逐步成为网络内容的主体。目前,基于关键字
中药新药试验平台是基于国家“863”项目开发的,本文以该平台的CRF表数据处理为背景,通过分析当前信息系统中数据表单所面临的问题和挑战,提出了信息系统的“表单定制”需求
词义排歧在机器翻译、信息检索、句子分析和语音识别等许多领域有重要的作用。因此词义排歧方法的研究具有重要的理论和实践意义。本文主要研究在标注语料库支持下的基于有指
运行在复杂、多变的上下文环境中的软件系统经常需要根据需求和环境的变化动态调整自身的结构和行为,即需要具有运行时自适应的能力。针对传统的软件系统形态(如信息系统)的
网络电视,是一种集网络、多媒体、通讯等多种技术于一体,向用户提供包括数字电视在内的多种交互式服务的崭新技术。它通过互联网络将网络电视节目信息传播给指定的用户,用户在接