论文部分内容阅读
当今社会交通越发发达,车辆相关证件快速、准确识别成为智能交通领域的重要课题之一。在不增加现有设备情况下,使用机器代替人工进行识别,可以迅速核对车辆信息,及时处理各类突发情况,具有良好的管理和经济效益。依托不断发展的电子信息技术,对和车辆信息密切相关的驾驶证进行OCR(光学字符识别)成为实现智能交通的重要步骤。实际拍摄图像中,由于拍摄环境差别明显,光照不均匀和倾斜现象等情况普遍存在,识别时需要根据图像进行差异化处理,处理过程中很容易丢失文字结构信息,导致字符识别错误,降低系统识别率。本课题的主要研究内容针对驾驶证的识别,系统设计采用的整体思路为“提取+识别”。围绕以上两方面,在分析驾驶证识别系统需求后,结合相关技术和方法实现了一个驾驶证件识别系统,本文的主要工作如下:1.借助OpenCV库完成文字信息提取。文字信息提取主要包括图像预处理、红章定位、文字区域截取、文字区域修正以及字符分割几个模块。针对红章定位模块,本文根据红章颜色和轮廓特性设计了较高准确率的定位算法;针对文字区域修正模块,本文结合拍摄图像在处理过程中所遇到的异常情况,提出完整的修正思路;针对字符分割,本文针对常见的字符重合问题提出准确分割算法。2.使用Tesseract-OCR引擎和TensorFlow框架进行文字信息识别。首先分析字库或模型的训练步骤,探讨优化思路,然后结合证件文字类型,针对文字区域训练字库或模型,实现16*32像素的证件字符图像识别。3.设计通用的系统架构。结合需求分析,将系统划分为四个模块,即I/O、信息提取、信息识别、显示编辑。本文虽然以驾驶证作为主要研究对象,但是系统具有很强的通用性。比如当使用系统识别行驶证时,需要修改的仅仅是红章和文字信息区域的位置关系,其他模块皆可复用。最后使用项目提供的样本图片库进行系统测试。测试结果表明:本文提出的证件识别思路正确并且可行,不仅提高字符识别效率而且提升用户体验,达到预期目标,对后续基于光学字符识别的应用研究具有借鉴意义。