论文部分内容阅读
近几年来,无论是国有商业银行,还是股份制商业银行,对银行业务电子化处理都给予了前所未有的重视,电子化集中处理成为各银行建设的重要目标,实现对票据的电子化和自动化处理己成为银行新业务增长的一个关键。因此金融票据自动处理系统以其较高的学术价值和应用价值越来越受到国内外众多著名研究机构以及学者的广泛重视。
对银行票据的自动处理一般由以下几个步骤组成:首先,把要处理的票据通过扫描仪、摄像机等输入设备输入到计算机中作为图像数据储存下来;其次,对电脑中的票据图像进行处理,识别票据类型;再次,在票据类型识别的基础上,进行票据有效信息(包括打印体和手写体)的定位和截取。在票据识别的基础上,实现有效信息的定位是不难的,因为每种票据包含有效信息的区域在图像中都有固定的位置。第四,识别截下区域中的有效信息并记录入数据库中。这些有效信息包括:用户名、账号、操作金额、操作员、日期等。在以上处理步骤中,票据类型的识别是十分关键的一步。
通过对图像处理和模式识别相关理论和成果的研究,本文提出了一个比较完整的票据类型识别系统模型,对票据类型识别流程中的关键模块做了详细的讨论,并且给出了具体的实现方案。首先,通过图像预处理使得票据的表格结构图像与背景和字符图像实现比较完美的二值分割,同时尽量修复表格框线的断裂,这样既可以减少图像的像素位数,提高后面算法的处理速度,又可以减少图像中无效的干扰信息,降低后面算法的实现复杂度;然后,在直线检测的基础上实现票据框线的矢量化,并通过细化、合并和修正使得矢量化的结果集合尽量小而精确,该矢量化集合不但能够减少图像储存空间,还能够为后面的特征提取提供参考。最后,本文根据票据图像中各特征信息在识别时所起的作用大小,采取分层的思想提取特征值,并与模版库进行分层匹配来完成票据类型的识别。实验结果表明,本文的矢量化算法能够比较准确地还原票据的表格框架结构,同时识别算法具有较高的识别率和较低的复杂度,并且抗噪声和断裂的能力较强。