论文部分内容阅读
论文第一章为本论文的绪论,在该部分作者概述了化学模式识别的基本发展情况,着重讨论了线性判别分析,聚类分析和模式识别在气体传感器阵列上的应用等研究上的难点和热点等问题,针对这些问题,从而确定了本论文的研究方向。 论文第二章提出了最近局部最大值搜索聚类算法。这是一种基于核函数密度估计的密度聚类方法。在该方法中,利用梯度搜索算法对每个样本沿着最速上升方向(即梯度上升方向)进行局部最大值搜索来获得高斯核函数密度估计的局部最大值。这个局部最大值是样本沿着梯度上升方向所能找到的概率密度的最近的最大点,实际上就是样本所属聚类的代表点,通过使用该算法,每个样本都自动收敛到自己所属的聚类的代表点,从而完成对整个数据集的聚类。可靠性曲线被用来确定合适的高斯核平滑系数取值和评价聚类结果。通过对模拟数据和真实数据的进行处理的结果表明,该方法能有效的在没有任何关于数据先验信息的基础上对具有任意形状聚类结构的数据进行聚类分析。 论文第三章结合隐变量方法改进了现有的误差平方和聚类准则函数,在此聚类准则的基础上提出了一个基于隐变量模型的聚类算法,目的在于充分利用多维的化学量测数据可以被少数隐变量表出的特性来解决高维化学量测数据的聚类问题。通过对模拟数据和真实化学量测数据的进行聚类分析的结果表明,该方法能有效的处理高维化学量测数据的聚类问题。 论文第四章引入了支持向量机算法的最优分类面的概念,基于最优分类面使被分类的两类间隔最大的思想,提出了最大类分离投影判别准则。其基本思想是找到一个投影矢量,使得两类数据在该矢量上的投影实现最大程度的分离。结合该准则,利用实数遗传算法作为优化工具,发展了最大类分离投影线性判别法。通过对模拟数据和真实数据的进行分类判别表明,该方法具有较高的预测能力,并且对线性不可分数据有较好的分类效果。 论文第五章使用基于隐变量模型的聚类算法对两组金属氧化物半导体(MOS)传感器阵列数据进行模式识别。一组数据为表面涂有不同金属氧化物催化涂层的SnO2气体传感器阵列对醇,酮,酯类挥发性气体的响应数据。另一组为金属氧化物半导体(MOS)传感器阵列对甲烷,乙烷,丙烷,和丙烯四种烃类气体的响应数据。聚类结果表明,基于隐变量模型的聚类算法能够准确识别两组传感器阵列数据中对应不同气体物质的样本。