论文部分内容阅读
图像分类问题是通过各种机器学习算法使计算机自动将各类图像进行有效管理和分类。由于受图像不规则性、光照、尺度变化等因素的影响,使该项工作存在着许多的难点。深度学习作为近些年提出的新的机器学习方法,因其在图像特征学习中的突出表现而得到广泛关注。本文深入探究了一些深度学习模型发现,相比于一些浅层的机器学习模型,深度学习模型对于复杂分类问题,尤其是目标对象具有丰富含义时,其表达能力及泛化能力更强。这种通过一层层的非线性网络结构来表征数据的内在分布,体现了对输入样本数据的强大的本质特征抽取能力,有效地刻画了这些数据的内在信息。因此本文着重研究了基于深度学习模型在图像分类问题中特征提取阶段的工作。本文的主要研究工作如下:(1)利用深度学习模型的层次特征学习能力,在特征汇聚阶段引入图像中目标的显著性信息,增强了图像的特征表达能力。通过在图像层次稀疏表示中引入图像显著信息,加强了图像特征的语义信息,得到图像显著特征表示。同时相比于手工指定特征,我们的模型采用无监督数据驱动的方式直接从图像中学习到有效的图像特征描述。在2个常用的标准图像数据集(Caltech 101和Caltech 256)上进行的实验结果表明,结合了图像显著性信息的层次特征表示相比于基于局部特征的单层稀疏表示在性能有了进一步的提升。(2)此外本文还结合了卷积网络和深度置信网络的各自优点,探索了卷积深度置信网络模型在场景图像分类中的潜在应用。虽然卷积网络对图像的位移、缩放及其他旋转等变化具有良好的适应性,但是其忽略了图像中的高阶统计特征。而在深度置信网络模型中,虽然在提取图像高阶特征方面具有很好的性能,但忽略了图像的局部不变性,对外部变化较为敏感。通过结合这两个优点,我们将其应用到场景图像分类中,得到了较好的效果。