论文部分内容阅读
模式分类是模式识别的一项重要内容,在许多领域已经得到成功的应用。本文主要从两个方面对模式分类进行了探讨和研究。一方面,针对近年来模式分类领域广泛关注的核方法,本文从以下几点进行了研究。(1)众所周知,核方法的性能受核参数的影响很大。核参数调节问题是核方法研究的重点和难点。基于如下思想:最优核参数应导致训练数据所对应的映射数据的空间结构满足相应线性算法的要求,提出一种核参数优化思路。如何描述映射数据的空间结构以及如何估计数据的空间结构与相应线性算法所要求的空间结构的逼近程度是新思路是否可行的关键。基于数据集的空间结构完全可由该数据集所张成的子空间的一组标准正交基来捕获的思想,提出一种描述映射数据空间结构的方法,回避了映射数据不可显式表示的难题。同时,基于最大熵原则的非高斯性测度,构造了一个估计数据分布逼近超球形区域程度的判别准则,用以指导支撑向量域描述算法的核参数优化问题。(2)在大训练集情况下,一般核方法面临计算代价大、特征提取速度慢的问题。为克服这些困难,基于最佳投影方向可由训练样本对应的映射数据所张成的子空间的一组基来线性表示的思想,提出一种简化方法。该方法具有通用性,适合众多核方法的简化问题。同时,为了快速寻找映射数据所张成的子空间的一组基,基于线性相关理论,设计了一种优化方法。利用该简化方法,本文分别提出了核Fisher判别分析和核主分量分析的简化算法,计算复杂度由原来的O ( n~3)降低至O ( r~3)(其中n表示训练样本数目,r表示基的个数),同时,特征提取速度也有明显提高。(3)如何抽取数据的有效鉴别特征是模式分类的关键。基于核化原理,提出一种非线性鉴别特征提取方法:核最优变换与聚类中心算法。该算法可提取稳健的非线性鉴别特征,解决复杂分布数据的模式分类问题。另一方面,针对模式分类的一个重要应用领域:基于高分辨距离像的雷达目标识别,本文做了以下几点工作。(1)针对雷达目标识别中,参数化密度估计方法存在的“模型失配”问题,基于高分辨距离像的统计特性分析,提出一种非参数化密度估计方法——累积量随机学习方法,估计距离像的概率密度。基于外场实测数据的实验证明了该方法的有效性。(2)首次尝试将参数化方法与非参数化方法相结合,估计距离像的概率密度。基于“Gamma—SLC”混合密度估计方法的雷达目标识别实验表明:该方法融合了参数化方法与非参数化方法的优点,同时也回避了二者存在的缺陷,识别率较单一方法有明显提高。(3)借鉴最大熵原则的非高斯性测度,提出一个评价密度估计方法的准则。相比传统的密度估计性能检验标准,该准则更易于操作,而且具有通用性。