票据中手写体大小写金额识别的研究

来源 :四川师范大学 | 被引量 : 0次 | 上传用户:yyandmwm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济高速发展,金融业市场化进程日益加快,票据业务不断膨胀,票据数量与日俱增,而票据处理工作十分繁重。为了摆脱这种繁重重复的劳动,计算机识别发挥了重要的作用,票据自动识别系统的研究就显得非常必要。脱机手写体字符识别是当前光学字符识别(OCR)技术研究的热点之一,也是模式识别领域一个极具挑战性的课题,它在信函分拣、银行支票识别、统计报表处理以及手写文稿的自动输入等诸多方面发挥着巨大的作用。票据中的手写体字符的自动识别是这类系统的关键。本文主要是针对票据中手写体大小写金额识别的研究,目的在于能在该领域做些有益的探索。   首先是对票据图像进行预处理,通过二值化,去噪,平滑等一系列预处理工作,得到较利于识别的二值图像;通过版面分析,确定识别所需要的大小写金额区域;同时采用Hough变换去除框格线,从而得到待识别的手写体大小写金额字符串。   其次是对小写金额的识别,本文在研究了多种经典切分算法的基础上,采用了基于字符图像凹凸特性的数字串切分方法。该方法从根本上克服了已有算法需要细化、路径搜索等复杂处理的弊端,从而大大提高切分率,缩短切分时间。在数字识别阶段,采用了基于凹凸特性的整体结构特征的字符识别方法,利用了字符的整体结构特征,识别过程简单快速。   接着是对大写金额的识别,对大写金额的汉字图像进行了预处理方面的工作,包括平滑、去噪、汉字切分、汉字大小、位置归一化处理以及细化等处理;提取了弹性网格方向像素统计的特征,该方法根据汉字方块字的特点及笔划分布的统计特征,对手写体汉字进行横竖撇捺四个方向韵分解,并利用一系列的弹性网格对汉字分解后各分量的象素进行统计而提取特征。最后,采用了神经网络的方法来对汉字进行识别,设计了BP神经网络分类器的结构。   最后是分别对手写体小写金额和大写金额的识别结果进行分析,提出了关联相似识别策略,并将识别结果进行关联,在识别结果不一致的情况下采用一个Beyes分类器,将相似程度高的字符识别结果做为输出,从而提高整个字符识别的精确度。
其他文献
在数据网格中,通过数据复制为地理上广域分布的用户提供多个数据副本,能够减少访问延迟,增强数据局部性,提高数据的可靠性,和分布式应用的可扩展性及性能。而数据复制技术的
沥青高速公路路面裂缝自动检测技术对于整个高速公路路面养护管理系统有着非常重要的意义。传统的人工检测方法已经不能满足现代检测的需求,随着计算机技术的发展,路面检测技
随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。从实用性和经济性考虑,构建基于Web技术的网络管理平台是大多数院校教学管理的一个重
非线性科学是一门研究非线性现象共性的基础科学,其中混沌理论是非线性科学的一个重要分支,混沌现象是20世纪人类最重要的科学发现之一。在过去的20多年时间里,随着人们对混
计算机快速发展的网络时代,快捷、方便、廉价的数字传输手段为人民获取和交流信息带来了极大便利;同时,计算机应用软件的发展也大大带动了办公自动化的发展进程,信息的传递、共享
随着市场经济的快速发展,制造业的生产规模日益增大。实际生产中,各种工艺约束,资源约束,生产能力约束等平行存在,这就需要对生产作业进行合理的调度安排。而一个好的调度安
随着云计算技术的不断发展,需要存储的数据正在以指数型增长,云平台环境变得更加复杂和多样化,人们对数据存储性能的需求也日益上升和不断改变。作为云平台的基础组件,分布式
软件可靠性是衡量软件质量的一个重要指标,软件可靠性测试是确保和提高软件可靠性的一个重要手段,在众多可靠性测试模型中,Markov模型一直是研究热点。在基于Markov模型的可
随着数字电视的普及和VOD系统的发展,人们可以通过有线电视网络在浩瀚的影视海洋里漫游。然而,由于影视资源的爆炸式增长,很多用户经常会“迷失”其中,他们往往找不到自己真
如今互联网的飞速发展是另所有人欣喜的,而且这也说明互联网使用的TCP/IP体系结构和协议规范取得了巨大的成功。   但是互联网发展的速度和规模,也是所有人始料未及的,制定TC