移动智能终端证件信息识别系统的开发与实现

来源 :武汉工程大学 | 被引量 : 0次 | 上传用户:Daniel999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的信息录入方式是采用人工方式先填写相关表格中信息,再由内部工作人员按照表格内容把关键信息存入计算机,或者是,到指定地点进行证件的扫描上传。前一种方式虽然不限制信息录入的地点,但每一次信息的录入都需要耗费大量的人力物力资源,并且容易出现错误的输入。后一种,虽然在信息录入的效率和准确率上都有提高,但是使用地点却相对固定。移动智能终端的出现,使随时随地进行证件信息的录入成为可能。移动智能终端上的信息识别系统可以广泛的应用于服务性行业、交通系统、公安系统等需要对证件信息进行查验的部分,无需大量人员即可完成证件信息的采集查验,提高采集查验工作中证件信息识别的效率和准确率,具有广阔的应用前景。如何对不同证件中的文字信息进行良好的提取和识别,是开发证件信息识别系统的关键问题。识别一个证件图像的关键信息,首要任务是对其关键信息进行正确提取。本文针对不同证件,设计了不同的图像预处理方法,以确保证件信息能正确提取。本文采用一种字符笔画宽度逼近的二值化方法,对图像进行二值化,减少图像中背景、污点、反光等造成的影响,有效提升信息的识别率。本文在信息识别方面根据不同字符特点,采用了两种目前较为流行的方法对文字进行识别。针对英文数字,本文采用Tesseract-OCR引擎进行识别。英文数字字符结构简单,类别较少,使用Tesseract引擎的识别率已满足本文系统需要,且生成的字符集体积小,满足移动智能终端的使用要求。针对中文汉字,汉字结构复杂且种类众多,使用Tesseract引擎识别率不高,且生成语言体积较大,本文使用一种基于特征提取和卷积神经网络的汉字识别方法,将传统特征提取方法与神经网络结合,弥补了单独使用神经网络训练的过程中丢失的特征信息,并在其每一层使用Dropout技术,有效预防神经网络在训练过程中的过拟合现象,提高最终模型对于文字的识别性能。该方法提升了文字的识别率,且生成模型较小,文字识别速度较快,便于移植到移动智能终端。本文针对以上需求,开发了一款移动智能终端的证件信息识别系统,目前主要支持识别身份证正反面以及行驶证。该系统分为安卓版本和iOS版本,支持市面上绝大多数手机。该系统能成功识别证件上的英文、数字、中文,英文数字识别率在98.4%左右,身份证号码识别率达到99.2%左右,中文识别率达到98.27%左右,证件整体识别率大约为90%。
其他文献
<正>2016年,北汽新能源全年继续保持高速增长势头,整车销售52187辆,同比增长159%,成为中国纯电动汽车名副其实的第一品牌。但对于北汽新能源的高速发展,也有人认为,他们是享
在现代产科的临床上,随着各种剖宫产术式的日趋完善,剖宫产手术已成为解决难产和严重的妊娠并发症和合并症,降低母儿发病率和病死率的重要手段之一。我院1998~2004年开展新式
随着国家对于新媒体发展的不断重视,用户的持续增长,新媒体发展呈现出新的态势和特征,其主要表现在:技术创新持续升级,助力实现智能互联;媒体融合加速推进,传播生态愈发丰富;
目的观察肩关节镜下治疗钙化性冈上肌腱炎的疗效。方法采用肩关节镜技术治疗20例非手术治疗无效的钙化性冈上肌腱炎患者。术中发现钙化灶均位于冈上肌腱,行钙化灶清除术、肩
背景胃癌是目前最常见的恶性肿瘤之一,全球发病率在所有恶性肿瘤中位居第四,仅次于肺癌、乳腺癌和大肠癌,而在癌症相关死亡中,胃癌所致死亡位居第二,这不仅严重危害人类的生
随着搜索引擎、云计算、人工智能这些新兴技术的成熟和普及,人类在日常中产生的数据量出现了前所未有的爆发式增长,催生了“大数据”时代的到来。在这种背景下,互联网与传统
经济改革体制、产业结构调整引发国企职工下岗 ,由此产生下岗人群再就业的特殊问题 ,即将转变为市场化的体制下失业人群再就业的普遍问题。就业在未来十年将始终是热点问题。
<正>只要有人提到"面朝大海,春暖花开",我们自然就会想到海子;只要有人提及中国当代诗歌,我们不能不想到海子。海子,带着对诗歌的热爱,带着破碎的理想,已经永远地离我们而去
<正>在最近几年中考中,我们经常遇到一类与双曲线有关的面积问题.要解决这类问题,应掌握以下几个方面的基础知识:设反比例函数式为y=k/x.(1)如图1,由双曲线上一点向两条坐标
目前,风险导向审计模式的应用已经成为一种必然趋势,在这一背景下,文章从国外审计模式与目标的历史演进、审计环境对审计模式的影响、审计准则中的相关规定、目前会计师事务