论文部分内容阅读
图像分类和匹配作为图像理解、机器视觉、模式识别等领域中的两项关键技术,也是近期以来的研究热点。图像分类和图像匹配的理论和算法研究,应用于遥感图像信号处理、医疗图像分析、特征识别、目标识别、图像检索、运动估计、车辆导航以及基于机器视觉的工业检测等诸多领域,受到了广泛的关注。 无论是对于图像分类还是图像匹配而言,图像的特征提取和表示都是十分关键的问题。不同的方法都有着各自的优、缺点。寻找获取图像的有效特征表示的方法,从而减少语义鸿沟将是一项长期的研究目标。对于图像分类问题而言,基于聚类的方法比较简单,但往往缺乏视觉上的精确表达。基于监督学习的分类方法尽管较之更为系统化,却要面对缺乏有效的训练数据的问题。相对于刚性图像匹配,非刚性图像匹配更具有普遍性。近年来对此进行了大量的研究,但是针对复杂形变图像匹配的问题还亟待解决。设计一个可以处理图像中形变、遮挡以及噪声等诸多问题的简单、有效、鲁棒的方案仍极具挑战性。 本文对图像分类和图像匹配两个基本技术进行了深入的分析和研究。论文研究内容涉及图像的特征提取、表达,统计学习理论,抽样选择性偏差理论,尺度空间理论,优化算法等方面。在前人的工作的基础上,在解决图像分类中已标注图像训练样本稀缺和非刚性轮廓匹配等问题开展了具有创新性的工作,主要体现在以下四个方面: 1.为了解决已标注训练数据稀疏性的问题,提出一种有效利用类似主题辅助数据的基于支持向量机的分类算法AuxSVM。首先,利用局部特征和矢量量化技术构造表示图像的视觉词典。基于该视觉词典,利用“Bag of Keypoints”的方法实现对图像的描述。基于适用于有限样本学习的支持向量机方法,利用类似主题的辅助图像数据,设计有效的分类方案。实验显示,系统性能得到了显著的提高。 2.提出一种有效利用辅助数据的半监督分类算法AuxTSVM。在利用类似主题辅助数据的同时,基于聚类假设,设计有效整合未标注目标图像中信息的分类算法,达到提升分类精度的效果。 3.引入基于核密度估计技术的分类框架实现图像分类。针对传统机器学习中的“固定分布假设”不满足的情况,假设训练数据和测试数据之间的差异主要是源自于抽样选择偏差所导致的不同分布。利用核密度估计技术对训练数据集和测试数据集的潜在概率分布进行估计。当完成概率分布的估计工作之后,采用重加权技术自动调整训练集的概率分布。基于此框架使得传统的分类算法可以有效地利用经过修正的训练图像进行知识学习,从而能够更好的实现针对目标图像的分类。 4.提出一个使用基函数的非刚性轮廓匹配算法。利用弧长对待匹配轮廓曲线进行参数化,将轮廓匹配问题转化为一个寻找匹配函数的函数逼近问题。设计满足一定约束条件的单调且连续的基函数,利用基函数的加权和来逼近匹配函数。基于弯曲能量模型,通过优化指标函数计算各个基函数的权重,实现轮廓匹配。尝试利用多尺度方法和遗传优化算法提升整体的匹配效果。