论文部分内容阅读
在计算机视觉以及计算机图形学研究领域,对自然场景中的事物进行精确的分类识别一直是该领域的研究热点。当前基于单分类器的图像分类结果具有不稳定性且不能平衡局部样本特征与分类器结果之间的关系。针对上述问题,本论文研究利用集成学习的方法来提高分类器分类结果的准确率。本论文通过研究非同质分类器学习方法的优点以及局部样本特征与分类器分类准确率之间的关系,利用典型相关分析的原理权衡局部样本特征在样本分类过程中的作用,并且结合非同质分类器的学习原理的差异性,实现差异化选择集成。本论文主要研究内容如下:(1)分析了本课题研究的背景意义以及现有的集成学习相关算法。本文简要的介绍了集成学习在图像分类识别技术中的重要作用,以及图像分类技术在商业、国防等领域的应用前景。其次介绍了现有的集成学习相关技术以及几种特征提取的方法,以及国内外在集成学习领域的研究现状。随后从逻辑回归方面进行阐述,深入探讨现有的单分类器特点与应用范围。最后介绍了几种应用广泛的多分类器集成方法,Bagging、Adaboost、Random Forest,以及他们的算法流程。(2)提出了基于局部典型相关分析的分类器集成策略。针对传统集成学习模型不能平衡局部样本特征在分类器分类时所起到的作用,不能兼顾局部样本特征与分类器分类结果之间的关系等问题,本论文提出了基于典型相关分析(Canonical Correlation Analysis,CCA)的分类器集成方法。本文通过寻找局部样本特征与分类器输出结果之间的多个典型相关变量,从而发现不同特征集合与最优分类器组合之间的最大关联,并用于集成分类。实验结果证明本论文所提方案在与传统的集成学习方法Adaboost与Majority Voting在UCI,Image Net等多个数据集上的实验结果对比证明本论文所提方法与其他集成学习方法相比能够有效提高集成模型分类准确率。(3)提出了基于局部多元伯努利的差异化分类器集成方法。针对同质分类器分类结果具有偶然性,且单一分类器只对特定样本分类具有敏感性等问题,提出了基于局部多元伯努利的差异化分类器集成方法。首先,本模型应用KNN的思想挑选局部待测样本,用此方法实现动态的调整多类数据集测试时分类器权重。其次,本方案使用待测样本的近邻来计算每个分类器对测试样本检测结果的概率均值,进而得到不同分类器对不同待测样本的敏感性,并以此从局部的方面考虑多分类器的分类能力高低,同时计算各分类器关于不同样本检测时的置信度加权值。最后,利用多元伯努利的思想将多分类器集成融合。在UCI、Image Net数据库中的多个数据集上的实验证明,本论文所提分类器集成方案与传统的分类器集成方法Adaboost、Random Forest相比能够有效提高分类器集成模型的检测准确率。(4)设计了基于局部多元伯努利的差异化多分类器集成的车牌识别原型系统。在上述研究的基础上设计了一套基于局部多元伯努利的差异化多分类器集成的车牌识别原型系统。该系统应用Matlab与Visual C++混合编程,并结合Opencv视觉库协助处理图像。该系统可以实现车牌定位功能、字符分割功能与字符辨别功能,并通过测试进一步说明本系统的可行性。