论文部分内容阅读
图像特征学习是计算机视觉和机器学习领域的重要研究内容,计算机视觉中的很多任务如图像分类、目标检测、图像分割等,首先会利用图像特征学习方法抽取原始图像的特征,然后再根据具体的任务实现相应的目标。根据目前的研究,当前流行的图像特征学习方法是子空间学习和深度神经网络,这些方法无需人工参与即可自动地通过端到端的训练提取高效的特征来用于分类识别等任务。然而,子空间学习方法在核方法的选择上存在一些不足。深度神经网络图像特征抽取方法目前也面临着诸多挑战,其有效性严重依赖大规模的数据,且通常被视为黑盒模型,解释性较差。针对上述问题,本文在图像特征学习领域展开研究,如下为本文的三个主要工作:1)第一个工作是以TSK模糊系统为基础,提出了一种基于模糊规则的图像特征学习的模型,使得模型具备模糊系统强大的学习能力和较好的可解释性。不同于经典的模糊系统通常用于分类和回归任务,本文把TSK模糊系统视为一个特征抽取模型用于图像特征的抽取。本文把TSK模糊系统的前件部分视为将图像数据从原始空间映射到高维空间的一种非线性转换,模型的后件部分可以根据需求选择不同的特征学习目标准则,避免了核函数选择的同时也使得模型具有了非线性抽取特征的能力。本文以所提的模型为基本框架,提出了两个具体的图像特征学习方法。2)第二个工作是在所提模型结构的深度上进行探索,提出了基于模糊规则的图像深度特征学习方法。该方法通过堆叠多层TSK图像特征学习模块的方式,实现图像特征的递进深度抽取,有效地综合了模糊系统具有可解释性的优点和深度学习架构的递进抽取特征的特点。其次,该方法特征学习的过程是前向进行的,不需要进行反向传播和迭代学习,因而具有较高的学习效率。为了在特征抽取的过程中保持图像数据的结构,该方法在每层的特征学习阶段采用主成分分析来保持数据的几何性质。3)第三个工作是在所提模型结构的宽度上进行探索,提出了基于模糊规则的多粒度图像特征学习方法。该方法通过引入多粒度窗口扫描策略,融合多个粒度下TSK-FS图像特征学习提取的特征,使得特征抽取能力进一步提升。为了尽可能保留原数据的判别信息,使得数据在低维空间中具有最佳的可分离性,本文在特征学习阶段采用线性判别分析来保持数据的判别信息。本文在不同规模的图像数据集上对所提的两种方法进行了充分的实验,实验结果表明两种方法在图像数据集上均具有较好的有效性,且对噪声、遮挡和光照等干扰因素有较强的鲁棒性。