论文部分内容阅读
现今,银行系统正努力提高其业务处理的效率。在银行的各种业务中,各种表单被大量应用。而这些表单以往都需要人工进行处理。录入的过程既慢而且容易出错。银行金融票据处理系统正是根据银行业务处理的需要而提出来的。金融票据处理系统借助计算机及相关设备的强大功能,将票据中的信息高速的输入到计算机中,并且建立数据库,对输入的信息进行管理,自动核对相关帐目,保证银行及金融系统业务往来的顺利进行。但是如何高速准确的将金融票据中的重要信息输入计算机是一个技术难题。普遍采用的办法是用高速的扫描设备将票据扫描后形成图象输入计算机。再对票据图象中的重要信息区域进行定位、提取。在票据的重要信息中,用汉字书写的金额是其中很重要的一部分。如果能使用计算机准确的识别金融汉字的图象,无疑将大大提高整个处理系统的处理能力。本研究课题的主要目的旨在解决金融汉字的自动识别问题。 经过几十年的发展,汉字识别技术已经取得了巨大的发展。各种类型的汉字识别技术已经达到了相当可观的识别率。但是识别自由书写的汉字识别仍然是一个难题。金融汉字字符集中的字符种类虽然不多,但是由于手写的缘故,如何识别仍然是一个不小的难题。这主要是因为自由书写的汉字风格各异,不同的人有不同的书写习惯。甚至同一个人所书写的多个相同汉字,字型上也可能存在相当大的差异。所使用的书写工具的不同也会造成手写汉字的笔道粗细不同。这些都提高了手写汉字识别的难度。针对手写金融汉字的这些特点,我们研究完成了手写金融汉字的识别算法。该算法有如下特点。 首先,针对有的人书写的汉字字型比较随意、夸张的特点,采用了重心—中心变换的方法,有效的解决了这一问题。当所写的汉字偏向一边,这时采用重心—中心变换的方法,可以得到一个笔画分布均匀的图象,这使得此后的分类结果更为稳定,受字型变化的影响不大。 其次,采用16值变换的方法描述了手写汉字的结构特征。汉字的字型比较复杂,这一特征表示方法符合汉字字型的结构特点,为汉字特征的抽取打下了dweed\ 硕士学住论文 进吓》芬 *“IrSn*IS基础。 再次,提出了v”v+8呛的网格特征分类方案,使分类结果更为稳定。 最后利用动态弹性有序匹配规则,有效的提高了识别系统的速度和精度。 为了有效的针对实际情况进行研究工作,我们收集了大约四万多个实际的手写金融汉字字符。经测试,使用本系统达到了95%以上的识别率。得到了令人满意的识别结果。