论文部分内容阅读
随着软硬件技术的不断发展及大数据时代的来到,深度学习已经成为了研究的热点。并在图像识别、语音识别和自然语言处理等领域都取得了卓越的成果。卷积神经网络是一种常用的深度学习方法,同时是目前发展较好的深度学习方法之一。相对于传统方法,此方法能够自主学习到高效的特征并进行分类。但是若卷积神经网络层次过深,网络参数过多,可能会导致网络的训练速度减慢,难以收敛等问题。为了设计出识别率更高且参数更少的网络,本文在改善经典卷积神经网络结构的基础上,不断优化参数,得到了网络性能较好的训练模型,实现了提高识别率和减少参数的目的。最终将卷积神经网络应用于行人再识别领域,其实验结果验证了模型的有效性。本文的主要研究内容与创新点如下:(1)介绍了卷积神经网络的基本概念,主要包括工作原理、网络基本结构等;简述了深度学习的Caffe框架、数据预处理方法及实验阶段所使用的数据集。(2)针对传统的卷积神经网络提取特征信息不够充足,分类精度较差,容易过度拟合等问题,提出了一种基于多分支聚合的卷积神经网络。此网络在传统卷积神经网络的基础上,不增加参数的同时增加网络宽度和深度,优化和改善网络,进一步提高网络的特征表达能力,丰富提取特征的多样性,提高图像分类精度,防止网络过度拟合。最后通过在两个公开数据集CIFAR-10和CIFAR-100上进行的一系列比较实验,对此网络、传统网络及其他网络进行了比较与分析,从而证明了此网络的有效性。(3)针对传统深度卷积神经网络虽然分类精度较好,但是参数量巨大,难以在内存受限的设备上进行部署的问题,提出了一种多尺度并行融合的轻量级卷积神经网络架构PL-Net。首先,将上层输出特征图分别送入两种不同尺度的深度可分离卷积层,然后对并行输出特征信息进行交叉融合,并加入残差学习,设计了一种并行轻量型模块PL-Module;同时,为了更好地提取特征信息,利用尺度降维卷积模块SR-Module来替换传统池化层,最后将上述两个模块相互堆叠构建轻量级网络。实验阶段,在CIFAR-10,Caltech-256和Food-101数据集上进行训练与测试。结果表明,与同等规模的传统CNN,MobileNet-V2网络及SqueezeNet网络相比,PL-Net在减少网络参数的同时,提升了网络的分类精度,适合在内存受限的设备上进行部署。(4)行人再识别是智能视觉领域的一个极具研究价值的方向,但是由于拍摄环境的不可控性导致了研究的难点,因此本文将卷积神经网络应用于行人再识别领域,采用轻量级的网络提高行人再识别的准确率,并与其他四种网络模型在Market1501、Duke两个公开行人再识别数据集的测试集上进行性能评估,证明了提出方法的有效性。最后,编写了行人再识别的可视化工具,能够显而易见的展示模型效果。