论文部分内容阅读
随着汽车的使用率和普及率越来越高,相关的安全问题也日益增多,人们对于识别速度和精度也有了更高的要求。而近年来深度学习的理论逐渐发展成熟,为这一问题带来了新思路。深度学习可因为其可自适应学习在识别速度、灵活性和准确性上也有着明显优势,而卷积神经网络作为深度学习中被研究最多和最深入的一类,也已经被广泛使用,在图像检索、语音识别、人脸识别、翻译等领域,也取得了非凡的效果。与传统神经网络的全连接不同,卷积神经网络中全连接和非全连接交叉使用,这种网络结构在对图像的平移、比例缩放、倾斜等操作的变化上有很高的适应性,非常适合对图像数据的处理学习。深度学习的不断发展带来的是对开发框架的大量需求,因此涌现了一大批包括本文使用的Caffe在内的多种深度学习框架。Caffe框架以其不需要用代码来设计网络、训练过程中速度快,以及拥有大量已经训练好的经典模型等优势极大地便利了大家对于深度学习的研究,在前沿的工业界和学术界被广泛应用。而VGG模型因为在多个迁移的学习任务中表现效果都要优于其他模型,并且又是从图像中提取CNN特征的首选算法,所以成为研究的首选模型。本文主要研究的是在静态图像中,通过深度学习中的卷积神经网络完成对车型的识别,而且通过实验证明其相较于其他模型能更适应对车辆的识别研究,并且做到能在速度和准确率上有明显的优势。基于这一点主要进行了以下几项工作,首先对车型识别的意义和国内外发展现状进行了简单介绍,然后介绍了实验所需的相关理论知识,包括机器学习、深度学习。介绍了本文主要研究的卷积神经网络的相关结构和函数,并且通过对比选取最适合的ReLU函数。之后通过对主流深度学习框架以及模型的横向对比,分析本文使用的Caffe框架以及VGG模型的原因。最后利用Caffe在VGG上实现了自己数据的训练,并针对样本数据进行调整从而达到更好的实验效果。与传统的VGG模型相比,本论文设计的网络层级较少,没有很大的运算量,但也能达到很好的识别效果,实验表明准确率可以达到95%以上。