论文部分内容阅读
随着互联网数据的迅猛增长,如何有效且高效的管理和利用这些数据成为了当前互联网亟待解决的一大难题。针对这一问题,模式识别方法具有相当广阔的应用前景。然而,模式识别算法的性能受到了有限先验信息的制约。因此,设计有效且高效的判别学习算法,使其能够在学习过程中最大限度的利用给定的先验信息,是模式识别问题的一大挑战。本论文着重研究用于连接低级视觉特征与高级语义之间的语义鸿沟的策略,从而实现针对模式识别问题的判别学习,主要包括如下几个方面:(1)基于字典学习与协同表示的分类方法:稀疏表示的方法是协同表示方法的一个特例,被看做是具有稀疏约束的协同表示方法。在稀疏表示分类方法中,字典和重构误差都起到了重要的作用。而字典上的稀疏表示系数具有由字典的样本元素层确保的类判别性。受这一性质的启发,我们针对性的研究了字典与重构误差在特征层的类判别性,提出了基于稀疏表示与多目标优化的特征层成分重要性学习框架,用于提高稀疏表示分类问题中的字典与重构误差的判别性。(2)基于图映射与流形学习的分类推理:在流形学习中,图具有获取数据间关系的能力,从而利用全局数据的流形分布实现判别学习。因此,针对图像分类问题,我们利用图映射来进行判别学习,建立视觉特征与高级语义之间的联系。特别地,我们利用图拉普拉斯构造了两个不同的映射模型,分别用于特征映射和类标传播。特征映射通过获取全局数据的判别结构来学习判别特征,类标传播进一步将已有的样本类标传递给无标记样本,从而实现图像的分类推理。(3)基于字典学习与流形学习的可扩展分类模型:基于重构的方法通常使用有监督的形式进行字典学习。然而,有监督学习策略中用到的有限的类标信息并不能满足全局数据的先验要求。相反地,半监督学习策略能够利用大量的无标记样本来近似数据的流形分布,利用所得的流形结构进行学习。此外,基于字典学习的分类具有很好的可扩展性,这恰巧是半监督学习所欠缺的方面。因此我们提出了基于平滑表示的类标传播方法,通过实现字典学习与半监督学习的互补,进行特征空间与类标空间的双字典学习,减小语义鸿沟,建立可扩展的分类模型。(4)基于流形学习与核学习的分类:核技巧是一个非常强大的技术,能够获取复杂数据分布环境中样本间的非线性关系。因此我们研究了结合核学习与半监督学习的判别学习方法。该方法采用自适应约束与子核传播策略来获取全局数据的判别核矩阵,利用所得的核矩阵进行图像分类。特别地,自适应约束能够根据样本间的相互关系传播先验信息,而子核传递通过分块学习极大地确保了全局核矩阵学习的效率。(5)显著度估计、图像分割与检索的应用研究:计算智能的研究目的是用来方便人类的日常生活。因此,在模式识别问题中,分析用户的需求与喜好是非常有必要的。我们研究了基于用户输入的判别学习方法,实现了针对个别用户需求的图像分割与检索系统。交互式的前景提取系统允许用户提供感兴趣目标与其相应背景的标记,进而将其作为有监督信息指导判别学习与前景提取过程。在交互式的图像检索系统中,类似地,用户通过提供候选图像上的相关性反馈以指导学习和图像排列过程,实现个性化的图像检索。我们进一步的将上述核学习方法应用到显著度估计问题。在显著度估计中,显著点的传播确保了显著图中物体的完整性。改方法通过物体完整性导向的显著度估计,实现图像中的显著区域检测。