论文部分内容阅读
场景识别是计算机视觉领域重要的研究方向,场景图片的类间相似性和类内差异性使得场景识别极具挑战性。深度学习技术的迅速发展给场景识别算法研究提供了新的研究思路。本文旨在通过对场景识别的传统方法与深度学习技术的发展现状的研究,提出基于深度学习在场景识别技术中应用的解决方案。本文首先融合传统识别方法与深度网络提出了混合深度场景识别网络;此外,基于场景识别过程中的类别显著性机制,提出了改进的多任务场景识别框架。本文首先结合传统场景识别方法和深度学习方法的优缺点,提出了混合深度场景识别方法,该模型首先在混合识别的Fisher编码层和判别层之前用深度直连自编码器作为图像局部特征提取层,完善了整个混合深度识别框架。采用直连非监督深度网络输出直接重构输入,能够提取更有判别性的中尺度局部特征。此外,通过改变场景图片对应局部图像块的构成实现场景数据扩充。引入图片所在类中出现概率低的图像块作为类内干扰加入原图像块中,减少类内差异误判。为了减少类间相似性影响,通过信息熵度量引入相似类中特有的关键图像块,替换原先图片中类别相关的图像块,同时改变对应标签,突出关键图像块对相似类别判断的决定性。实验表明该算法具有鲁棒性,可以有效权衡识别效率与准确率。针对训练数据中大量的有标签场景图片,可以反演出场景图片类别相关的显著性区域,提出了一种基于类别显著性的多任务场景识别框架。该算法使用选择搜索与粗分类器去生成类别相关的显著性场景图像作为重构目标,选择搜索用来生成场景图片的局部区域,对应局部图像输入到粗分类器得到整个图片的类别相关置信值,进而生成显著性场景图片。结合其他辅助网络的多任务的深度学习框架进行场景识别,可以有效的避免过拟合,基于显著性图像重构的网络可以对场景图片的判别起着较好的辅助作用,减小场景图像中非类别相关部分对判别造成的干扰。实验表明该方法可以抑制类间和类内干扰,提高场景识别的准确性。