基于OCR技术的通用证件识别系统

来源 :南昌大学 | 被引量 : 0次 | 上传用户:superyoumyhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会网络化的推进,各种纸质文档的数字化进程也在加速。经过近九十年的发展,对字符识别技术的研究已经取得很大的进展,现在市场上各种OCR软件层出不穷。虽然字符识别的应用已经取得较大的发展,但是大都集中在文档识别中,对于证件识别依然是一个难题。为了解决证件识别中,每种识别系统只能识别单一种类证件的问题。在原有OCR技术的基础上,设计了通用证件的识别系统。通用证件识别系统主要包括三个模块:预处理、版面分析和OCR引擎。预处理模块。包括灰度化、去噪、图像二值化和倾斜校正四种操作。灰度化操作考虑到彩色图像处理的难度大,采用适宜人类视觉观察的加权平均法对证件图像进行灰度化;去噪操作是为了保证图像的边界特征不被模糊,选择自适应中值滤波的方法对图像进行去噪;图像二值化操作可以突出感兴趣的目标内容,使用逐点法对灰度图像进行二值化,可以很好区分证件图像的前景和背景;倾斜校正操作使用Hough变换可以把倾斜的证件图像校正,增加系统处理较差样本的能力。版面分析模块。包括模板制作、类型判断、属性判断、区域合并和字符分割过程。为了确定证件中需要识别的项目,首先要先制作典型的证件模板,并保存在系统中。通过使用感知哈希算法,与典型模板对比,确定目标证件的种类;其次,对证件切割获得单个项目,利用投影原则判断项目的属性,区分字符、表格和图片元素;接着,通过连通域提取与合并,获得完整的项目信息;最后,利用投影法把序列性的项目内容分割成独立的字符。OCR引擎模块。采用深度学习识别方法,为了加快参数收敛,减少训练时间,选择基于局部调节模式的卷积神经网络对证件的项目内容进行字符识别。利用食品经营许可证,餐饮服务许可证,食品流通许可证三种证件近千张样本对本系统进行验证,结果证明通用证件识别系统可以同时处理不同种类的证件,识别率比较高,且处理复杂证件的能力较强。通过通用证件识别系统在身份证识别上的实验说明,其识别准确率已经达到市场上同类证件的先进水平。
其他文献
三维激光打标技术是对激光的一种应用,可以实现在三维自由曲面上快速打印复杂、清晰且美观的图形图案。同时,由于激光打标具有无接触,无切削力,热影响小等特点,使用三维激光
目的:分析常用傣药“傣百解”原植物等9种云南产牛奶菜属植物种间亲缘关系。方法:应用ISSR分子标记技术。结果:从60个ISSR引物中筛选出25个引物用于试验,共扩增出391个条带,
结合江西蚕桑生产实际对多批次养蚕模式下蚕病发生原因进行分析,提出了针对性的防治方法,以利于控制多批次养蚕模式下蚕病的发生.
移动机器人作为21世纪最伟大的发明现在越来越多的应用于工业生产和日常生活当中。其中对机器人的视觉研究更是移动机器人领域的核心问题之一。机器视觉的一个主要研究方向就
大牛地气田下古生界奥陶系风化壳是该区块寻找储量接替区的勘探层系,到目前为止没有重大突破,因此加强对其储层发育特征的研究具有非常重要的现实意义。论文以碳酸盐岩沉积学、
我国干旱区半干旱区主要位于西北地区的内蒙古高原、塔里木盆地和准噶尔盆地等。这些干旱及半干旱地区的面积占全国陆地总面积的30%,但人口稀少,只占全国人口的4%左右。因为该地
智能视觉监控是计算机视觉领域的一个应用热点,它能在不需要人干预的情况下,通过自动分析摄像机拍录的图像序列来对被监控场景中的变化进行定位、跟踪和识别,并在此基础上分析和
国运兴衰系于教育,教育发展需要理论支撑.无论是教研组织还是科研部门,都是产出教育理论成果的专业机构,对教育改革发展具有重要的支撑、驱动和引领作用.广大教育工作者特别
期刊
激光焊接已经成为焊接制造业中最具发展前景的焊接技术。在激光焊接过程中必须依靠先进的焊缝跟踪系统来保证焊缝和激光束的精确对中以获得良好的焊件,传感技术的应用为焊缝的
随着风力机向更大和更柔的方向发展,柔性叶片的挥舞、摆振和扭转振动更为剧烈,使流经叶片的气流产生复杂的非定常流动,形成动态气动载荷;同时,动态气动力又会进一步加剧叶片的振