论文部分内容阅读
车牌识别技术作为计算机图像视觉识别研究领域的一个热门研究课题,在计算机发展的年份中已经不断有新的算法和技术手段被应用进来。常见的车牌检测识别一体化系统一般使用图像处理的基本图像预处理手段和基于模式识别的匹配技术进行识别。汽车车牌本质上可以看作汽车的身份证,车牌与汽车是唯一绑定的关系,通过对于车牌信息的准确获取,便可以获取到与当前车辆相关的各种信息。在常见的交通管理中,对于车牌的准确识别能够大幅提升交通智能管理的效率和执行率。本文在通过对车牌识别的理论研究背景,现实应用场景,国内外研究现状,以及现实应用场景中所面临的问题和难点等做出了充分调研之后,本文提出了一种改进的车牌检测识别一体化系统。其可以在低对比度,光照分布不均匀等复杂的现实应用场景(如交警手持式执法设备)中拥有比传统的车牌检测识别系统更高的车牌检测识别率。本文研究的主要内容如下。1.通过对研究背景的分析调研,得出结论即现阶段的车牌检测识别系统应用场景十分广泛,现实中对于高效率高准确度的车牌检测识别系统的应用需求日益增高。而随着近些年计算机运算能力硬件基础的不断发展,使得实时的车牌检测识别系统成为可能并在现实场景中得到了广泛的应用。对于车牌检测识别的国内外研究现状的调查分析发现,车牌检测识别系统从最初的理论提出到第一次的算法实现再到新技术,新硬件的不断引入,其对于只有英文字符和数字字符组成的车牌的识别率从初始阶段的80%在逐年提升,在机器学习理论方法和深度学习理论方法引入车牌识别领域后,对于英文字符和数字字符组成的车牌的识别率高于95%,而这其中也面临着诸多问题和难点没有得到解决。如高车牌识别率一般基于充分光照背景条件下,正角度拍摄的车牌照片,这种设备一般设置于交通卡口等地点,对于车牌图像的环境条件等要求较高,而当车牌图像环境变为复杂时,其识别率就会显著下降;以及对于中文车牌的识别率低于英文车牌,其原因在于车牌字符分割和文字识别阶段,对于中文车牌第一位的省份简称分割成功率和识别率较低,这是由于中文字符的非连通性以及复杂性导致的。为此,本文提出了一种可以在复杂光照和低对比度背景条件下对于中文车牌有较高识别率的系统,并基于现实应用考虑,减少其对于硬件环境的需求,以达成可以通过手持拍照设备在复杂环境下等进行车牌检测识别的目的。2.文献综述部分,通过对于车牌检测识别相关的国内外的历年文献综述,分析了车牌检测识别系统的一般化处理流程。车牌检测识别系统一般分为两个部分,其中第一部分为车牌检测,从拍摄带有车牌的复杂环境背景中检测出车牌的所在位置,并提取出带有车牌的子图片;第二部分为车牌识别,即从第一步中将提取出的带有车牌的图片的子图块进行文字分割后依次识别,最后转换为代表车牌的有序字符串进行结果输出。3.车牌检测部分的设计和实验。本文首先介绍了实现工业应用的常见的车牌检测算法即基于车牌边缘特征检测的方法和基于车牌颜色特征检测的方法。并分析了两者的优点和不足。其次设计了车牌检测模块的基本处理流程,即依次通过高斯模糊,灰度化对原始拍摄图片进行车牌图像去噪声和去除颜色特征处理后,再调用改进的最大稳定极值区域算法对车牌所在区域进行粗检测。在粗检测过程后,使用仿射变换等手段对角度倾斜的粗检测车牌图片结果进行角度校正。将粗检测的结果归一化后作为支持向量机的训练数据进行标签后训练,待模型训练完成后便可以使用已经训练完成的支持向量机模型对车牌检测进行预测。其中高斯模糊操作是为了去除原图像中的噪声干扰,对图像进行模糊平滑处理,避免噪声对检测过程出现干扰。灰度化操作是为了去除图像的色彩特征,减少计算机处理压力,并为之后的最大稳定极值区域算法输出前置处理结果。本文所使用的最大稳定极值区域算法(MSER)融合了种子生长方法(Seed growing)即先通过MSER提取出车牌的可能区域,过滤掉尺寸不符合车牌大小的区域,然后通过文字分类器,找出高概率的字符定位结果作为强种子字符定位结果,对强种子字符定位结果进行聚合后,计算出车牌的中轴线位置,之后通过中轴线位置寻找出低概率的弱种子字符定位,其中包括较难检测出的,部分不为连通的中文字符,最终将检测结果进行轮廓提取。在MSER算法之后,对于拍摄角度偏斜的车牌图片,先进行角度判断,对于角度偏斜过大的车牌进行旋转后再采取仿射变换的手段使其图像输出变为正角度矩形。至此,车牌检测的粗检测结果输出后,通过局部二值模式(LBP)算法获取图像的纹理特征,选用LBP算法是为了提取出车牌图片的纹理特征,并选用LBP特征图谱中每个子模块的统计直方图进行链接从而构成一个特征向量,基于该算法的车牌检测模块对于光照变化和低对比度的环境具有很强的鲁棒性。最后将输出结果作为支持向量机(SVM)的训练数据进行标记后训练,得到训练完成的模型后,便完成了车牌检测模块。4.车牌识别模块的设计和实验。在上一部分中,检测出了车牌区域并提取出含有单幅车牌图像的子图块后,便可以将结果送入车牌识别模块进行字符识别以及结果输出。本文首先阐述了通过灰度化的图像预处理方法将车牌图像灰度化后,通过二值化的方法进行灰度化后图像的处理。二值化过程中采用了空间大津阈值算法(Spatial Otsu),即按照图像的灰度特性,将图像分为图像背景和目标图像两个部分,通过背景和目标两个部分之间的类方差进行二值化的分割。空间大津阈值算法在面对光照分布不均匀的车牌图像上拥有较好的二值化效果。在二值化过程之后,通过取轮廓算法得到车牌图像的字符轮廓。对于中文车牌,由于部分中文字符并不连通,取轮廓操作会出现断裂现象。因此本文采用的做法是先获取中文车牌的后6个字符,再通过第二位的城市代码对轮廓外接矩形进行左平移的操作,便可以提取出中文省份代码的字符。关于城市代码的字符位置确认,采用中文车牌的先验知识,按照车牌的字符分布距离进行城市代码字符的位置确认。再进行完字符分割的过程之后,便可以对分割完成的字符进行标记分类,之后作为ANN的训练数据集进行训练。为了保证中文字符的识别率,本文采用了 2个ANN模型分别对中文字符和英文数字字符开展训练.期间使用了基于指数加权平均的带有动量的梯度下降方法对模型进行优化,缩短了 ANN模型的训练时间,提高了 ANN模型的预测准确率。在模型训练完成后,便可以对分割出的字符进行有效的识别顺序输出。5.介绍了本文所采用的数据集,即Chinese City Parking Dataset(CCPD)数据集。作为开源数据集,CCPD涵盖有不同拍摄环境下的车牌图片。其中包括不同分辨率下的车牌图片,不同光照下的车牌图片,不同距离下拍摄的车牌图片,不同拍摄角度的车牌图片等。本文还加入了自建数据集用于训练。本文采用的实验环境为本地实验环境,选取Visual studio作为开发IDE,并配备有OpenCV3.1.0作为视觉算法库。再获取实验结果之后,引入了 ICDAR2003评价协议,通过精确度,回报率,Fscore等指标对车牌识别效果做出评价。并对于车牌识别整体过程中的每一步骤进行结果展示和分析。在对于实验结果的分析中得出结论,即本文使用的改进的MSER算法和LBP与SVM的结合模型在面对光照不均匀及低对比度条件下表现要优于传统的基于车牌边缘特征检测和基于车牌颜色特征检测的车牌检测算法。在车牌识别过程中,中文字符识别率及复杂环境下字符识别率要优于传统的基于反向传播神经网络和卷积神经网络的车牌识别算法,而使用了基于指数加权平均的动量梯度下降方法的模型训练时间和精度也要优于传统的ANN模型。6.综上所述,本文实现了一种在光照不均匀和低对比度环境下依然具有良好识别率的车牌检测识别算法,并且对于中文车牌的识别率相较于传统的车牌检测识别方法有所提升。该识别算法使用ANN作为车牌识别模块的识别模型,对硬件需求较低,可以实现更快速识别的同时保证识别准确率,并对于现实应用中的硬件设备要求较低。并在最后提出了本文的未来工作点以及改进点。