基于OCR成绩单录入系统的设计与实现

被引量 : 0次 | 上传用户:xiaolinshihonggang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的高速发展,在这个社会上受教育的人群越来越多,需要录入的成绩单信息很多,如果不恰当的使用人力资源,会造成人力资源的浪费,因此有效的进行人员使用,对于我们来说是至关重要的,我们在这里迫切需要解决的问题,就是将手写成绩单的信息快速录入到电脑里。集合科研课题,以成绩单某一部分为模板,我们自主设计了一个关于OCR技术的成绩单手写识别系统。论文主要完成以下的工作:(1)成绩单中一般都有表格线,由于手写上的因人而异,成绩单的表格较小,所以我们一般将表格线消除后在进行识别。所以本文采用了基于霍夫变换的直线检测技术,再结合自适应中值滤波技术使直线消隐。(2)在成绩单中有很多个信息块,如:学生姓名、成绩、科目信息块等有效信息块。为了将这些信息块准确的识别出来,我们一般根据成绩单图像的版面分析,采用连通域的办法将这些信息块识别出来。(3)本文通过对行和字符的切分。以汉字的拓扑结构为原则,将汉字大小归一后,进行汉字细化,这样的切分方法有效的解决了在汉字识别过程中汉字字符切分后的变异问题。(4)基于汉字细化方法,本文采用了密度特征、网格特征、外围特征相结合的特征提取办法,通过对轮廓分段特征的提取,有效的将字符特征提取出来。(5)在基于字符特征的切分过程完成后,根据手写字符的密度特征、网格特征以及外围特征和模版中的手写字符的密度特征、网格特征以及外围特征的差的绝对值来提取字符特征,最后进行模版匹配,完成汉字手写字符的识别。(6)本文针对成绩单图像进行了不同模块的处理工作,其中包括图像的预处理、版面分析、手写字符分类等OCR相关模块,模块之间的功能相对独立,这也是基于程序设计的模块化原理,在最后对所有模块进行整合,并且最终在基于数据库的处理方法后,将我们识别出来的结果和数据库里面的内容进行校对,从而最终完成了在OCR技术上的对成绩单手写识别技术。
其他文献
用社会主义核心价值观引领当代中国大学精神对大学师生思想政治建设与我国高等教育的发展有着十分重要的意义。本文从马克思主义关于人的全面发展理论和文化认同理论以及高等
目的:观察保留齿线切扎并断桥缝合术治疗环状混合痔的临床疗效,介绍一种新的治疗环状混合痔的手术方法。方法:将60例患者随机分为两组,治疗组30人,对照组30人。治疗组采用保留齿线
笔记能力在交替传译中扮演着非常重要的角色,直接影响口译的质量。良好的笔记能力不仅能够帮助口译员最大程度地记录源语信息,译员还能通过笔记,重新梳理源语的语句结构和语序,分
作为信息产业的核心,作为国家经济和社会发展的战略性基础,软件的价值及其所具有的巨大辐射性和带动性作用将得到社会各方面的足够重视,软件市场的进一步培育和完善将成为必
本文的研究对象-玉米纤维(也称玉米皮)是湿磨法加工玉米淀粉生产过程中产生的一种廉价且丰富的副产品,其重量约占玉米干重的10-20%,现阶段一般将该玉米纤维作为动物饲料使用,其综
当前人类生活在一个科技的社会中,软件技术正在改变着人们的生活,从腾讯QQ、阿里巴巴的淘宝网、支付宝钱包、团购网站以及IOS、安卓等移动操作系统的问世,人们的工作和生活无
作为糖尿病最常见的慢性并发症之一,糖尿病周围神经病变的临床表现多样,病变过程具有隐匿性、渐进性特点,且病变的发展程度与临床症状往往不符,是造成非外伤性截肢的主要原因之一
过去几十年来,标准方案在全球治疗和控制结核病(TB)方面发挥了极其重要的作用。这种方案可使80%的初治TB患者得到治愈,但对公共卫生资源匮乏的贫穷国家而言,6~9个月的TB疗程不
玛咖属于十字花科,一年生或两年生的草本植物,主要生长在高寒地区,此地土壤贫瘠,生态环境非常恶劣。玛咖的种植历史悠久。玛咖营养成分丰富,它能够提供能量和人体必须的营养物质,有
目的:比较逆行腓动脉穿支筋膜蒂皮瓣和逆行胫后动脉穿支筋膜蒂皮瓣的皮瓣成活相关并发症(简称并发症)、修复范围、皮瓣重建肢体的功能结果(简称功能结果)和供区并发症,为这两