基于矢量化特征的金融票据类型识别系统研究

来源 :四川师范大学 | 被引量 : 0次 | 上传用户:ylfxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,无论是国有商业银行,还是股份制商业银行,对银行业务电子化处理都给予了前所未有的重视,电子化集中处理成为各银行建设的重要目标,实现对票据的电子化和自动化处理己成为银行新业务增长的一个关键。因此金融票据自动处理系统以其较高的学术价值和应用价值越来越受到国内外众多著名研究机构以及学者的广泛重视。 对银行票据的自动处理一般由以下几个步骤组成:首先,把要处理的票据通过扫描仪、摄像机等输入设备输入到计算机中作为图像数据储存下来;其次,对电脑中的票据图像进行处理,识别票据类型;再次,在票据类型识别的基础上,进行票据有效信息(包括打印体和手写体)的定位和截取。在票据识别的基础上,实现有效信息的定位是不难的,因为每种票据包含有效信息的区域在图像中都有固定的位置。第四,识别截下区域中的有效信息并记录入数据库中。这些有效信息包括:用户名、账号、操作金额、操作员、日期等。在以上处理步骤中,票据类型的识别是十分关键的一步。 通过对图像处理和模式识别相关理论和成果的研究,本文提出了一个比较完整的票据类型识别系统模型,对票据类型识别流程中的关键模块做了详细的讨论,并且给出了具体的实现方案。首先,通过图像预处理使得票据的表格结构图像与背景和字符图像实现比较完美的二值分割,同时尽量修复表格框线的断裂,这样既可以减少图像的像素位数,提高后面算法的处理速度,又可以减少图像中无效的干扰信息,降低后面算法的实现复杂度;然后,在直线检测的基础上实现票据框线的矢量化,并通过细化、合并和修正使得矢量化的结果集合尽量小而精确,该矢量化集合不但能够减少图像储存空间,还能够为后面的特征提取提供参考。最后,本文根据票据图像中各特征信息在识别时所起的作用大小,采取分层的思想提取特征值,并与模版库进行分层匹配来完成票据类型的识别。实验结果表明,本文的矢量化算法能够比较准确地还原票据的表格框架结构,同时识别算法具有较高的识别率和较低的复杂度,并且抗噪声和断裂的能力较强。
其他文献
生长在不同的力学环境下的活体细胞将发生多种不同程度地适应性变化。定量研究细胞和亚细胞结构的运动和形态的动态变化特性,有助于理解力学刺激和细胞生长的关系,也有助于理解
可定向投放是网络广告的一大特点。数字时代的新技术使网络广告的定向投放成为可能:网络广告可以投放给某些特定的目标人群,甚至可以做到一对一的定向投放。数据挖掘作为一种先
目前世界上所有的数据库系统都没有提供故障排除的功能,全是容错概念,鉴于国内外技术现状归根结底都是容错技术,不可避免存在两个问题,一是允许故障共存,无法预防故障的发生,
使用IEEE 802.11协议的无线局域网(Wireless LAN, WLAN)当前已经有了广泛的市场应用,但是由于无线网络开放性的特点和802.11协议自身存在的缺陷,无线局域网的安全性一直受到
通过图形学的方法描述自然界的各类现象一直以来都是计算机图形学研究者所关注的重点,而对动态流体的模拟问题更是其中的难点研究问题。从流体模拟方法的发展进程来看,经典几
机器音译就是根据发音将给定的源语言中的专有名词自动翻译成目标语言对应的词汇的过程。相对于机器翻译而言,机器音译不存在语义层次的翻译要求,并且是一种顺序翻译的过程,
Internet的不断发展,网上新闻信息的获取已成为人们知识来源的主要途径。但是,随之而来的“信息爆炸”,使得人们通过搜索引擎或者浏览网页很难从大量的地搜索结果中获取方便的、
随着搜索技术的发展,纯粹的web搜索由于受到IE的束缚,因而表现出应用能力偏低,而基于桌面的搜索则相当于一个“客户端+数据库”这样的应用模型,尤其加入了划词搜索的功能,这也使得
学位
随着SoC系统规模的持续扩大,系统验证复杂度也随之增加。传统的验证方法很难进行完备的验证,验证技术已成为制约SoC技术发展的瓶颈。为缩小与设计制造的差距,一系列高级的验