论文部分内容阅读
身份证是我国18岁以上成年人的有效证件,记载了持有人的基本个人信息和一个唯一的身份证编号。在目前大多数情况下,身份证登记采用人工方式,很不方便。随着计算机技术、图像处理和字符识别算法的成熟,利用计算机进行身份证自动识别录入已经成为可能。身份证识别系统可以广泛用于服务性行业、交通系统和公安系统等需要身份证检验的部门,节省大量的人力物力,具有广阔的应用前景。 本文对身份证识别进行了比较深入的研究,在一个简化模型的基础上,详细阐述了系统的处理流程:行分割、预处理、识别前处理、特征提取、识别以及编号的识别后处理。针对身份证识别的特殊性,调整了预处理顺序:先在灰度图像下完成行分割、再进行图像增强、二值化,然后才作单字分割。文中提出了灰度图像下的行分割方法和基于最大宽度回溯算法的单字分割算法,从而实现了字符的精确定位。选用合适的二值化算法,完成了灰度图像到二值文本的转化。针对编号行数字,选取了能较全面地体现它们的结构和统计特性的31维特征向量作为原始特征。对汉字识别采取粗、细二级分类方法,分别选择了4维和72维特征向量。本文对31维特征向量运用因子分析法,得到了7个彼此独立的公因子变量。该方法不仅消除了变量之间的相关性,而且相当于给原变量加了合适的权值,使类间的方差更大,从而有利于识别。本文还充分利用了身份证中的先验知识,对编号进行了后处理,能修正部分数字的误判,并给出整体识别结果正确与否的判断,进一步提高了编号识别的正确率。实验表明了本文算法的有效性。