论文部分内容阅读
随着计算机图像处理、分析和理解,为了识别各种不同型号的目标和图像的技术日益成熟,身份证识别成为可能。身份证是公民的一张名片,它由政府机构赋予给公民并作为每个人独一无二的公民身份的证明工具。身份证上的身份证号码存储了公民的信息,身份证号是唯一的,在众多生活和工作的场合中都需要到身份证号。可用于各行各业比如应用于公安系统、银行系统、交通系统等需要验证身份证号的机构,身份证识别系统相比于人工来说最大的优势是准确、高效和安全。目前对于未获得公安机关授权的机构对身份证信息的采集基本还是人力输入身份证号,这样做工作效率非常低,输错数字的可能性比较大。因此开展基于图像处理与分析的身份证信息提取具有非常广泛的实际应用价值。我国二代公民身份证号码是一个字符组合码,由十七位码和一位数字验证码组成。从左至右的顺序如下:六位表示出生的本机代码,八位数字表示出生日期码,三位码的顺序和一个校验码。论文借助OpenCV进行身份证信息处理与分析的相关研究,论文主要内容包括身份证图像的预处理、身份证图像区域分割和字符分割以及身份证号识别三个方面,并在论文相关研究的基础上设计和实现了身份证信息提取的系统原型。1)针对身份证图像偏暗或偏亮问题,进行图像的灰度变换、灰度拉伸、二值化、图像归一化、图像校正以及图像去噪,以保证采集的身份证图像可以在一个比较理想的状态下,有利于后续识别精度的提高。2)针对身份证具有特定的版面布局结构,利用形态学的膨胀算子进行连通域的初始寻找,然后利用轮廓提取和标记策略进行连通域的划分,最终将获得的连通域运用于身份证图像的区域分割;同时对分割出来的身份证号区域利用灰度化、二值化、膨胀操作等一系列操作后完成字符的切分。由于分割出的字符区域具有字符大小不同的情况,最后将图像中的字符一个一个取出来并且归一化成指定大小的字符模板,以便提高系统识别性能的稳定性,并较好的克服图像噪声带来的影响,为字符识别做准备。3)针对论文研究主要是为获取身份证上的身份证号和人像信息,论文利用模板匹配的方法进行了身份证号的识别研究。首先根据数字图像特征编写数字字符库,并利用模板匹配的方法识别,通过字符的归一化处理与模板样本字符相关的遍历处理,最终识别出字符。由于身份证号码仅有11个,且大小字体固定,所以模板匹配识别算法相对于身份证而言是非常合适的,实验也表明了本算法的可行性。4)鉴于上述研究,实现了基于摄像头或照相机采集身份证图像下的第二代身份证号识别系统的软件原型,主要包括了预处理模块、区域分割模块和字符识别模块。