论文部分内容阅读
脱机手写汉字有书写不清楚和不规范等特点,这给脱机手写汉字识别带来一定的困难。本文设计了一种基于组合特征和隐马尔科夫模型(HiddenMarkovmodels,HMM)分类器的脱机手写汉字识别方法。 在特征选择与提取方面,本文采用了基于骨架方向特征和特征点的组合特征,首先对单个脱机手写体汉字图像进行细化,并对汉字图像进行弹性网格划分;然后在网格内对汉字骨架进行扫描,提取汉字的四种特征点和汉字图像的横、竖、撇、捺四种骨架方向线素特征;最后,将汉字图像的特征点分别在整体上、横向上和纵向上和汉字图像的四种骨架方向线素特征结合,形成整体特征、横向特征和纵向特征构成特征向量。 在分类器设计方面,采用HMM分类器,利用训练集手写汉字对分类器进行训练,采用传统投票法的平均值规则对各个HMM分类器的识别结果进行集成,将平均相似值最大的类别作为识别结果。对特定的小字符集脱机手写汉字图像的识别实验验证了该方法有效性。