论文部分内容阅读
目标检测和图像识别技术在计算机视觉领域中一直是国内外学者的研究热点。在研究过程中,提高目标检测和图像识别的准确率、提升模型效率是关键。深度学习作为机器学习中一个新的研究领域,通过构建深度学习模型(如VGGNet、GoogLe Net、ResNet等)来提取特征以解决目标检测和图像识别问题,是现阶段得到广泛关注的研究方向。卷积神经网络(Convolutional Neural Network,CNN)是一种在人工神经网络的基础上结合深度学习技术的新型神经网络。因其具有局部感受野、权值共享、空间和时间亚采样的特性,所以对图像的比例缩放、平移具有不变性。本文在已有的CNN研究成果基础上,重点介绍用于目标检测的SSD模型和在手写字符识别上有极好效果的Le Net-5模型。在此基础上,以车牌检测和车牌字符识别为例,对两个模型做出相应修改,实现以下两个方面的工作:(1)基于卷积神经网络的车牌区域检测研究针对车牌区域的形状及物理结构特征,本文提出一种基于SSD(Single Shot MultiBox Detector)模型的车牌区域检测方法。首先介绍SSD的网络结构,然后介绍本文所用数据集,真实标签则是采用BBox-Label-Tool工具在本文所提数据集上做标记得到的。进而根据我国车牌特征设计出默认框的长宽比等相关参数。再利用训练集对改进的网络模型进行训练、测试。实验结果表明,所提方法能够达到85.4%的正确检测率,具有一定的检测性能。(2)基于卷积神经网络的车牌字符识别研究针对车牌字符类别多且背景复杂,形状和结构简单的特点,在LeNet-5模型的基础上进行改进,使其适应于车牌字符识别。首先对分割后的字符进行预处理:大小归一化、去噪、二值化、细化、字符区域居中、去除复杂背景等;再利用预处理后的车牌字符集对改进的网络模型进行训练、测试。实验结果表明,所提方法能够达到99.96%的正确识别率,具有很好的识别性能。