论文部分内容阅读
多分类器组合的目的是希望能够充分发挥每个分类器在各自分类器性能上的长处,以获得比任何单独分类器都要高的识别率。多分类器组合利用了不同分类器、不同特征之间的互补性,提高了组合后分类器的识别率。传统的组合方法存在着两点不足:其一,对组合的分类器只做定性的挑选,而没有跟识别对象结合起来挑选,这样做的缺点是不能很好的发挥各分类器的长处对样本进行识别;其二,各分类器在组合中所承担的角色是固定的,也就是对所有的样本只采用一种组合方式,这样处理可能对某一类样本是提高了识别率,而对另一类则可能起到相反的作用。为了实现组合分类器的最佳性能,就需要根据识别对象挑选适合的分类器进行组合,同时也需要根据不同的类别样本采用不同的组合方式。 本文对国内外分类器组合的研究进行了总结,概述了分类器组合的原因和组合的方法。首先介绍了几种特征提取方法,并对这几种特征提取方法做了比较。其次根据前人得出的理论对分类器组合的原因做简单总结,在此基础上提出了选择分类器的准则:分类器之间的错误相关性应尽量的小。同时建立了基于识别对象的分类器选择模型----模糊意见集中决策的方法,对已选择的分类器建立了基于模糊隶属度函数的最优线性集成的分类器组合。考虑到组合方式不仅与分类器的性能有关,还与识别对象的类别有关,本文采用了确定组合权重的方法是根据识别对象不同的类别,由MSE准则求出在各类别下的分类器的最优组合权重。最后本文采用了胜利油田的桥口油气田的岩性识别作为实例,对本文提出的方法进行了验证,结果表明本文采用的方法能明显的提高分类器的识别性能,这说明了该方法是可行的、有效的。文章的最后介绍了论文的不足并且提出了建设性的意见。