论文部分内容阅读
近来,国家和新疆维吾尔自治区对马产业高度重视,构建产业技术创新平台,以促进新疆马产业的发展。随着马产业平台的转型和升级,将全面实行平台的深度电子化。其中新疆马产业创新平台的用户登陆模块,需要进行实名认证,实名认证用户是通过上传身份证照片进行信息自动识别登记用户的身份信息,进行实名认证的用户可以拥有平台上更多的功能权限。由于身份证照片的拍摄场景、角度、设备、摄影师各有差异,传统身份证信息识别方法已经不能满足复杂环境下对身份证信息的识别准确性的需求。为了进一步提高身份证识别的准确率,克服外界环境干扰下的身份证信息的识别,可以更好的将身份证信息识别应用于马产业创新平台的实名认证模块中的信息登记。本文主要是基于深度学习身份证信息识别的方法,训练出相对应的神经网络模型对身份的信息进行检测与识别。
首先,为了防止实名认证过程中上传的图像非身份证照片,而是仅有身份证信息的文本图片,在对身份证信息进行检测识别之前,需要对照片进行鉴别,判断图像是否为身份证合格照片而不仅仅是信息文本图像,基于深度学习框架下利用ResNet残差神经网络模型对身份证照片进行鉴别,对输入计算机的照片是否为身份证进行分类,若判断为身份证照片再进行下一步身份证信息检测操作。通过三种不同层数的ResNet残差网络ResNet-50,ResNet-101,ResNet-152对比实验,最终采用ResNet-101模型对身份证照片进行鉴别,通过实验得到对身份证的鉴别准确率可以达到92.00%。
其次,本文利用深度学习方法训练复杂场景下文本检测神经网络模型CTPN(Connectionist Text Proposal Network)对身份证信息进行检测,检测出文字区域。由于光照对身份证检测的影响尤为突出,为了提高模型对光照因素影响的身份证信息检测的适应性,本次实验针对部分数据进行数据增强处理,主要是对身份证图片进行色彩,对比度,饱和度,色度的处理。利用LabelImg进行数据集标签的制作,利用VGG-16(VisualGeometryGroupNetwork,视觉几何群网络)提取身份证空间信息,利用RNN(RecurrentNeuralNetworks,循环神经网络)提取序列信息,通过文本线构造算法确定信息位置,通过测试数据集上的测试可以很好的检测出文本信息,利用目标检测评估指标AP对检测模型进行评估,信息检测评估指标AP值达到70.34%。
最后,通过深度学习方法训练稠密型神经网络模型DenseNet(Densely Connected Convolutional Networks)对检测到的身份证信息进行识别操作。根据身份证信息的特点,身份证上各类信息为不定长字符,所以采用不定长字符识别方法完成信息识别任务,利用大量不定长字符图片的数据集进行模型的训练,最终在测试数据集上识别准确率达到98.50%,由于训练数据集采用的是灰度图片,模型对灰度化处理后的图片适应能力更强,识别效果进一步提高。
首先,为了防止实名认证过程中上传的图像非身份证照片,而是仅有身份证信息的文本图片,在对身份证信息进行检测识别之前,需要对照片进行鉴别,判断图像是否为身份证合格照片而不仅仅是信息文本图像,基于深度学习框架下利用ResNet残差神经网络模型对身份证照片进行鉴别,对输入计算机的照片是否为身份证进行分类,若判断为身份证照片再进行下一步身份证信息检测操作。通过三种不同层数的ResNet残差网络ResNet-50,ResNet-101,ResNet-152对比实验,最终采用ResNet-101模型对身份证照片进行鉴别,通过实验得到对身份证的鉴别准确率可以达到92.00%。
其次,本文利用深度学习方法训练复杂场景下文本检测神经网络模型CTPN(Connectionist Text Proposal Network)对身份证信息进行检测,检测出文字区域。由于光照对身份证检测的影响尤为突出,为了提高模型对光照因素影响的身份证信息检测的适应性,本次实验针对部分数据进行数据增强处理,主要是对身份证图片进行色彩,对比度,饱和度,色度的处理。利用LabelImg进行数据集标签的制作,利用VGG-16(VisualGeometryGroupNetwork,视觉几何群网络)提取身份证空间信息,利用RNN(RecurrentNeuralNetworks,循环神经网络)提取序列信息,通过文本线构造算法确定信息位置,通过测试数据集上的测试可以很好的检测出文本信息,利用目标检测评估指标AP对检测模型进行评估,信息检测评估指标AP值达到70.34%。
最后,通过深度学习方法训练稠密型神经网络模型DenseNet(Densely Connected Convolutional Networks)对检测到的身份证信息进行识别操作。根据身份证信息的特点,身份证上各类信息为不定长字符,所以采用不定长字符识别方法完成信息识别任务,利用大量不定长字符图片的数据集进行模型的训练,最终在测试数据集上识别准确率达到98.50%,由于训练数据集采用的是灰度图片,模型对灰度化处理后的图片适应能力更强,识别效果进一步提高。