论文部分内容阅读
随着社会网络化的推进,各种纸质文档的数字化进程也在加速。经过近九十年的发展,对字符识别技术的研究已经取得很大的进展,现在市场上各种OCR软件层出不穷。虽然字符识别的应用已经取得较大的发展,但是大都集中在文档识别中,对于证件识别依然是一个难题。为了解决证件识别中,每种识别系统只能识别单一种类证件的问题。在原有OCR技术的基础上,设计了通用证件的识别系统。通用证件识别系统主要包括三个模块:预处理、版面分析和OCR引擎。预处理模块。包括灰度化、去噪、图像二值化和倾斜校正四种操作。灰度化操作考虑到彩色图像处理的难度大,采用适宜人类视觉观察的加权平均法对证件图像进行灰度化;去噪操作是为了保证图像的边界特征不被模糊,选择自适应中值滤波的方法对图像进行去噪;图像二值化操作可以突出感兴趣的目标内容,使用逐点法对灰度图像进行二值化,可以很好区分证件图像的前景和背景;倾斜校正操作使用Hough变换可以把倾斜的证件图像校正,增加系统处理较差样本的能力。版面分析模块。包括模板制作、类型判断、属性判断、区域合并和字符分割过程。为了确定证件中需要识别的项目,首先要先制作典型的证件模板,并保存在系统中。通过使用感知哈希算法,与典型模板对比,确定目标证件的种类;其次,对证件切割获得单个项目,利用投影原则判断项目的属性,区分字符、表格和图片元素;接着,通过连通域提取与合并,获得完整的项目信息;最后,利用投影法把序列性的项目内容分割成独立的字符。OCR引擎模块。采用深度学习识别方法,为了加快参数收敛,减少训练时间,选择基于局部调节模式的卷积神经网络对证件的项目内容进行字符识别。利用食品经营许可证,餐饮服务许可证,食品流通许可证三种证件近千张样本对本系统进行验证,结果证明通用证件识别系统可以同时处理不同种类的证件,识别率比较高,且处理复杂证件的能力较强。通过通用证件识别系统在身份证识别上的实验说明,其识别准确率已经达到市场上同类证件的先进水平。