论文部分内容阅读
随着人工智能与计算机技术的迅速发展,纹理分类在医疗、卫星、机器人等多个领域发挥越来越重要的作用,这些应用涉及到人们生活中的各个方面。作为计算机视觉领域图像分类任务中的研究重点,纹理分类一直以来受到了众多研究者的关注。区别于般图像的分类问题,纹理分类处理的图像更加具体,这使得不同纹理图像之间的类间差异较小。由于尺度、角度、光照的变化,同类纹理图像之间的类内差异比较大。以上这些因素使得设计一个鲁棒的纹理分类方法极具挑战性。由于混合高斯模型(GMM)具有较强的表达能力,因此被广泛地用于建模图像特征,特别是用于建模纹理图像。基于GMM图像建模的纹理分类方法已经在性能方面展示出了它的优越性。该类方法主要包括两个关键的组成部分:图像的特征提取和GMM之间的距离度量。众所周知,图像特征描述子在图像分类问题中扮演着至关重要的角色。随着深度学习的崛起,深层卷积神经网络(CNN)广泛地运用于图像分类、图像检索以及语义分割等领域,并获得了很好的效果。现有的基于GMM建模表示图像的方法中,特征提取阶段往往都是使用传统的基于手工设计的特征。受到卷积神经网络成功应用的启发,本文首次提出了基于深层卷积神经网络特征的GMM建模用于图像表达,同时广泛评估并分析了多种图像特征描述子的分类性能,包括两种基于深层CNN的高级语义特征以及五种广泛应用于纹理图像分类的基于手工设计的特征一灰度特征、Gabor特征、LBP、SIFT和协方差描述子。值得一提的是,评估多种图像特征对基于GMM建模的纹理分类方法的影响在本文工作之前并没有得到充分的研究。对于建模之后的GMM之间的度量,本文采用了高效且鲁棒的基于稀疏表示的推土距离(SR-EMD)算法。在SR-EMD算法中,两个混合高斯模型中各个分量高斯之间的距离测度是度量算法的关键,然而这个问题依旧是一个困难且开放性的问题。本文首次将现有的距离测度系统地分为了两大类:基于概率统计的距离度量和基于黎曼流形结构的距离度量,并分析研究了这些距离之间的差异和联系。基于分析不同距离测度之间的关系,并受到高斯嵌入距离(GE)和基于李群的距离(PLG)的启发,本文提出了一种改进的高斯嵌入距离(IGE),提高了分类准确率的同时验证了本文的重要结论。本文在多个具有挑战性的纹理图像库上评估了本文的方法,包括KTH-TIPS-2b、FMD和UIUC Material。实验结果表明:本文提出的基于深层卷积神经网络特征建模的GMM具有非常强的表达能力。同时,利用基于深层CNN特征的GMM和本文提出的距离度量的方法在所有纹理库上都得到了非常有竞争力的分类结果。除此之外,本文提出的基于深层CNN特征的GMM匹配方法具有很好的泛化能力,可以自然地扩展到图像检索问题:并且在2个常用的图像检索库即INRIA Holidays和UKB上得到了很好的检索结果。