论文部分内容阅读
图像分类是计算机视觉领域的热门研究方向,也是人工智能发展的重要基础。随着智能化移动端的快速普及,推动了全球移动数据流量的大幅度增长,与此同时计算机性能的不断提升,尤其是在GPU平台上的高性能计算,使图像分类任务的研究从传统方法渐渐转向基于大数据的深度学习方法。图像分类一般由特征提取、图像表征、构建分类器这三个主要部分组成。在图像分类任务中,如何选取最具代表性的特征对系统分类性能起着至关重要的作用,传统方法一般是由人工设计一个或多个特征相结合,然后对其调优后使用分类器进行图像分类,然而这种方法消耗了大量的时间和人力,并且很难达到很好的效果。通过研究者的不断探究发现,使用深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)可以从海量数据中自主学习到多层次的图像特征,并使分类精度达到了与人类接近的水平。因此,基于深度学习方法的研究成为了当下处理图像分类问题的主要方法。本文通过对DCNN进行图像分类的整体过程进行研究,发现存在的一些问题,并对其进行改进,主要工作内容如下:第一,针对传统DCNN模型中Softmax分类器存在的过早饱和及模型参数采用随机初始化训练时间长、识别准确率低的问题,提出一种将噪声注入Softmax并结合迁移学习的图像分类方法。首先,根据对Softmax饱和问题进行探究,对比注入的噪声参数选取对识别率的影响来找到最佳情况,从而产生更为宽泛的梯度并起到延迟饱和的作用;然后,利用公开预训练模型参数来代替随机初始化参数,并比较冻结不同卷积层对模型的影响;最后,在数据集上实验,证明所提方法具有良好的识别效果。第二,针对DCNN模型越大,使用的参数数量越来越多,和只能处理固定尺寸的图像。提出一种特征袋(Bag of Feature,BoF)结合DCNN的图像分类方法,称为卷积特征袋(Bag of Convolutional Feature,BoCF),它通过构建一个量化神经层对DCNN提取到的特征进行有效量化来减少参数数量,该方法可以与各种特征提取器和分类器组合形成高效的图像表征和识别系统。同时允许网络模型使用常规的反向传播算法进行优化迭代。所提方法能够降低网络参数,并实验证明了该方法的有效性。