论文部分内容阅读
手写汉字分割和多类别金融票据图像分类是实现票据自动处理的基础。非限定手写汉字分割问题是手写汉字识别的关键问题,也是目前的分割-识别框架中的难点。 本文提出了基于模板匹配和差影处理的票据图像分类方法。在原始票据图象上利用模板匹配先得到相应的有效图象,再运用差影技术对滤波去噪后的有效图象进行模板存在与否的检测。实际的票据分类处理实验结果证实了所提出的方法的有效性。 本文提出了一种改进的投影方法对非限定手写汉字图像进行先分割。根据非限定手写汉字的一些具体特征,对经典投影方法做了补充和扩展,在对字符图像进行二值化和投影去噪后,用最小二乘法获得字符的预验宽度,根据一定的准则判定了投影分割点。在现有方法的基础上建立了算法的基本模型,编写了相应的程序并应用于支票校验系统中。 在分割粘连和重叠的汉字串中,本文提出了一种结构分析结合后期识别的方法。对整个汉字图像进行连通域分析,得到初选的分割点。通过轮廓差分析以及投影分析,去除假分割点。采用本文的分割以及识别合并的方法,对12000个粘连和重叠的汉字串进行分割实验,准确率达92.4%。 最后,本文给出了一个后督支票自动处理系统,包括支票要素分割,大写金额字符串的分割,小写金额字串的分割和去噪,无限制手写体大写金额字符的识别,无限制手写体阿拉伯数字的识别等。该系统已经在实践当中得到了使用,取得了良好的效果。