论文部分内容阅读
随着互联网的广泛运用,如何有效地进行信息认证成为了一个很关键的问题,身份证信息认证是其中不可缺少的一部分,而对身份证图像进行光学字符识别是快速获取身份证信息的一种方法。针对身份证图像的光学字符识别第一步是对图像进行预处理,好的预处理使得最终得到的身份证版面干净,便于后续处理。本文就不同环境下手机拍摄的图像进行图像预处理研究,包括图像去噪,图像增强,图像二值化,得出了一套适应性强的预处理算法流程。随后要考虑的是图像中文本行的检测与分割,本文将拍摄出的图像分为复杂背景图像和简单纯色背景图像。因为基于深度学习的复杂背景下的文本行检测依赖于GPU,为了节省计算资源,使文本检测在CPU条件下运行,本文研究了基于简单背景下的文本行提取,在CPU上运行时显著快于复杂背景下的文本行提取,缺点是对于拍摄时的背景有限制条件,两种方法均可检测出身份证图像中的全部文本行。文本行分割采用传统的投影法,加上本文提出的一种后验方法,有效避免了字符汉字误分割的情况,能够将文本完整地分割成单字符图像。最后一步就是单字符图像的识别,本文采用卷积神经网络进行单字符识别,训练数据由代码生成,验证数据由真实拍摄的身份证图像分割而得到。为了解决分割过程中的数字容易粘连的问题,本文生成了多数字组成的单字符图像来识别多位数字。用于生成图像的字符总共有11820个,代码生成的海量单字符图像分批进行增量学习。训练数据选用的网络是ResNet-34,对网络进行缩减,参数调整,增量学习后在验证集上得到了较好的识别效果,对多张身份证进行识别测试,结果也比较准确。