论文部分内容阅读
计算机网络技术、视觉图像处理技术和深度学习的发展,为我们解决图像特征提取和图像分类提供了越来越多的解决方法。面对海量的数据图像信息,如何对其进行有效的图像分类与标注是当前面临的一个巨大挑战。处理大量复杂环境下的数据时,传统的神经网络模型已经不能够满足当前图像分类与标注的要求。研究卷积网络模型已成为有效进行图像分类与标注应用发展的必然趋势。本文先描述了图像分类与标注的研究背景与意义,图像特征提取、图像分类、图像标注、深度学习及卷积网络研究现状。接着描述人工神经网络发展和结构,研究神经网络反向传播算法,简单描述了深度学习,重点研究了卷积网络基本知识,包括局部感受野、权值共享技术、多卷积核与池化操作。然后重点设计复杂环境下的卷积网络。本文主要研究卷积网络结构设计与网络特征可视化。网络结构设计的层数和网络层对应参数在很大程度上决定了后续图像分类与标注结果的好坏。因此根据具体实际情况设计合理的网络层和优化参数是本文图像分类与标注重要的研究内容。训练网络模型和通过训练过程中调节参数是为了更好了提取图像的特征。本论文使用卷积网络提取图像特征,低层网络提取图像的边缘特征等底层特征,逐渐提取图像的利于分类任务的显著特征。将卷积网络每层上学到的特征信息呈现出来,实现图像特征可视化,能从一定角度探索卷积神经网络,帮助我们更好了解卷积网络怎样提取特征,同时也能帮助我们改进网络分类的性能。本论文基于深度学习框架,设计了复杂环境下的卷积网络结构并对网络参数进行优化。首先,本文设计的卷积网络初步确定为8层的网络模型结构,包括前五个卷积层、三个全连接层其中包括输出层。其中前五层卷积层的第三层和第四层没有连接池化层,这样设计目的为了不出现输入卷积层图像大小小于相对应卷积核大小。第一个卷积层用随机池化,第二个和第五个卷积层用最大池化。然后,对每层网络进行具体参数设计,包括每层卷积核、步长及是否进行像素补偿等等具体操作。使用PReLU激活函数代替ReLU激活函数。输出层选择采用Softmax分类器来对图像分类。最后,在制作的复杂环境下的数据集基础上,训练设计的卷积网络,并调整网络网络参数,对随意拍摄的照片进行测试,进行结果分析。通过实验分析,设计的卷积网络结构取得了很好的性能。