论文部分内容阅读
脱机手写体汉字识别是模式识别领域一个极具挑战性的课题,它将在信函分拣、银行票据识别、统计报表处理以及手写文稿的自动输入等诸多方面发挥巨大的作用。如果能使用计算机准确的识别汉字的图像,无疑会大大有利于解决传统人工处理方式中存在的工作量大、成本高、效率低、时效性差等问题。因此,手写体汉字的识别研究有着重大的现实意义和十分广阔的应用前景,一旦研究成功并投入应用将产生巨大的社会和经济效益。本文针对脱机手写体汉字中的预处理、特征提取、特征融合等进行了研究,完成了手写体汉字识别研究领域中的以下几个方面的工作:1、预处理在手写体汉字识别中占有重要地位。它包括二值化、平滑、细化、规范化等。对手写体汉字进行非线性规范化,能有效地减少同类字符之间的差异。本文讨论了手写体汉字的预处理方法,实现了几种非线性规范化方法,并进行了实验比较。2、在特征提取方面:本文首先介绍了两种常用的方向分解方法:OR方向分解和AND方向分解,并基于弹性网格技术进行特征提取。另外本文实现了一种简单加权方法和两种考虑周边邻域网格的加权方法:高斯加权和线性加权。本文首次将Kirsch边缘梯度方向分解应用到汉字识别上。3、在特征融合方面:汉字的结构特征能够反映出其全局特性,而统计特征又能反映出其局部特性。因此本文选取了几种具有互补性质的汉字特征,并基于主成分分析的特征融合方法进行了融合实验。4、最后,本文还对网格方向特征、模糊网格特征和融合后的特征进行了整票识别的仿真实验比较。其中融合后的特征的整票识别率达到了94.53%。