论文部分内容阅读
随着人工智能技术的不断成熟,身份证上信息的自动与精确获取在公安、铁路、银行等行业中的需求越来越多。并且随着移动互联网时代的来临和移动设备高性能的实现,智能终端已经变成综合事务处理的平台,让身份证的移动识别成为可能,这大大提高了识别的便捷性。基于此,本文实现了在Android平台上,通过图像处理和模式识别的方法,完成身份证的自动识别。本文的主要工作分成如下四个部分:(1)字符图像分割。首先对于Android平台得到的满足要求的图像进行处理,依次使用灰度化、缩放、自适应阈值Canny边缘检测、概率Hough变换找直线、透视变换分割出无畸变、无背景的身份证图像。其次分别利用比例坐标和投影法分割出含有所需信息的矩形区域图像和字符图像。(2)基于手工设计特征的汉字印刷体识别。本文首先针对汉字类别庞大的情况,提出如下改进的特征组合方式:依次提取汉字外围特征、笔划穿越次数特征、汉字网格特征,分别依据欧氏距离进行特征匹配,完成汉字印刷体识别。而对于训练集小的信息区域,比如身份证中的性别、身份证号,只提取网格特征。然后依据欧式距离完成特征匹配。该识别算法被使用在无服务器的独立安卓平台上。(3)基于卷积神经网络的汉字印刷体识别。本文在技术上所做的改善点是:针对特征匹配方法的缺陷和身份证汉字图像遇到的情况,使用python的PIL库得到含有腐蚀、膨胀、旋转、噪音的方正黑体简体图像数据集;基于卷积神经网络做了网络设计,在TensorFlow平台训练出测试精度在99.8%的模型;在服务器端使用训练好的模型。(4)系统实现。首先完成字符区域定位、字符分割、字符识别三大算法部分的开发,然后通过使用android里的JNI机制,将程序移植到Android里,进而完成图像获取和身份证信息显示两大部分,综合起来形成一个基于C/S模式的Android平台应用程序。