论文部分内容阅读
手写汉字识别是人机交互智能接口的重要组成部分,对于实现办公自动化、提高计算机的输入效率具有重要意义。由于汉字类别数量大、结构复杂、相似字多、书写风格多样等原因,手写汉字识别一直是模式识别研究领域的难点之一。马尔可夫随机场(Markov Random Fields, MRFs)将上下文限制条件整合到概率论中,在计算机视觉中得到成功应用。受此启发,本文研究了MRFs在手写汉字识别中的应用。通过研究MRFs在复杂性和不确定性问题中的应用,提出了一种基于MRFs的手写汉字统计结构模型,基于此模型研究MRFs在手写汉字识别中的应用。与传统手写汉字模型相比,提出模型的优势有:(1)多笔画特征。将汉字同一笔画根据不同笔画提取结果表示成模型的多个节点,巧妙地处理了笔画提取过程中由于书写风格差异、结构复杂等特点造成的不确定性。(2)模型拓扑结构自动形成。与传统采用监督方式初始化模型拓扑结构相比,提出的模型在训练过程中根据邻域系统自动形成拓扑结构,方式更简单。在模型匹配阶段,针对MRFs后验能量函数最小化问题,本文提出了对特征节点进行模糊标记以及对能量函数分阶优化的策略,提高了模型匹配的效率。针对HCL2000字库中前50个汉字类别的识别实验表明,提出的手写汉字识别方法识别正确率达到90.88%,对部分结构复杂汉字正确率可达96%,充分说明了本文方法的有效性。在笔画提取过程中,为了保持汉字图像笔画连接,提出了一种细化改进算法。通过重新定义原算法中保持连接的限制条件,增加了细化算法对于手写汉字图像的适应性。实验表明,细化效果得到了改善,算法应用到手写汉字识别中正确率提高了8.68%。针对基于Gabor滤波的传统笔画提取方法中,Gabor滤波器参数设置复杂、图像模板运算量大的问题,本文提出了一种综合细化和Gabor滤波的笔画提取策略,利用快速的细化算法减少Gabor滤波器的计算量。实验显示,Gabor滤波器的计算量降到了原来的6.72%。另外,针对常用的手写汉字特征提取方法在后续线性区分分析(LDA)特征变换中,不利于发现相似汉字细微区分信息的不足,提出了一种基于2DLDA变换的手写相似汉字特征优化方法。将传统的手写汉字特征提取和LDA变换表述为像素级特征的二维特征矩阵优化问题,利用2DLDA变换进行手写汉字特征矩阵的优化。实验表明,使用优化后特征对相似汉字的识别错误率降低了48.86%。