论文部分内容阅读
近些年来,基于核函数的学习方法(核方法)已经成功地用于解决模式分类领域中的各种问题。它具有两个显著的特点:首先,是在线性与非线性之间架设起一座桥梁,即它通过核函数隐含的将数据投影到一个高维核特征空间中,使得线性算法得以在该空间中处理非线性可分的数据。其次,是通过巧妙地引入核函数,使得学习算法的计算复杂度不受样本维数的影响,从而避免了“维数灾难”问题。多视角人脸检测问题中的人脸模式与非人脸模式之间,基于内容的图像检索问题中的图像视觉特征表征和人们对图像的语义理解之间,都呈现出复杂的非线性关系。本论文围绕模式分类领域中的这两个现实应用问题,对核方法的加速算法和核函数优化理论展开了较为深入的研究,另外,论文还对图像检索中的形状特征描述、小样本集情况下的距离度量学习问题进行了研究。本论文的主要创新点概括如下:1)提出了一种能够以多分辨率方式对数据进行分类的分类器,即提升核MPP分类器。它具有在分类复杂度和分类精度之间进行调节的机制,从而克服了传统SVM分类器运算复杂度大,不适用于实时分类的难题。2)提出了一种基于经验核空间的多分辨率聚类算法,即KBCL。作为一种非线性聚类算法,KBCL具有存储开销少,无需事先指定子类别数,对初始类别划分不敏感,能进行多分辨率分析等优点。这些优点使其适用于对大数据量的数据集进行聚类分析。3)采用KBCL聚类算法和提升核MPP分类器,设计了一种多分辨率树状结构的多视角人脸检测器。该检测器在学习过程中能够自动对人脸样本集进行多分辨率划分,并创建对应的多分辨率树状检测结构;检测时能够以由“粗”到“精”的策略快速、准确地实现对人脸目标的定位。4)针对高斯核函数的参数选择问题,提出了一种正则化核离差矩阵准则(RKSC),该准则具有对非奇异线性变换的不变性。因此,采用RKSC准则选出的高斯核参数,能够准确反映数据在核空间中的分布特性,而不受坐标系统选择的影响。针对SVM分类器的核选择问题,提出了一种基于特征空间的类别可分性度量(FCSM)。FCSM度量从理论上可以看作是对半径间隔界度量的一种简化近似。因此,通过最小化FCSM度量来优化多个高斯核函数的组合系数,可以降低SVM分类器的分类错误率上限,从而提升SVM分类器的分类能力。这两种方法在整个参数选取过程中无需训练和测试分类器,并且也不需要复杂的二次优化过程来求解度量函数,因此,都能够以较高的效率完成对核函数的优化。5)提出了一种基于广义霍夫变换的图像形状特征描述方法,该方法在具有平移、尺度和旋转不变性的同时,还具有较好的鲁棒性,可以有效地描述具有局部缺损和部分被遮挡的图像目标。并且由于霍夫变换方法本身,具有对数据库中的图像进行初步筛选的能力,这确保了后续图像匹配环节的高效性。6)提出了一种基于半监督优化核偏重鉴别分析(S-KBDA)的距离度量学习方法。S-KBDA算法能够同时根据监督样本提供的鉴别信息,和非监督样本提供的几何分布信息,来学习投影矢量,这在一定程度上克服了小样本集情况下的过学习问题。另外,S-KBDA算法在学习投影矢量的同时,还能够对所采用的核矩阵进行优化,从而确保采用学得的距离度量可以最大程度地改善图像检索系统的检索精度。