论文部分内容阅读
该文论述了脱机手写体汉字识别的隐马尔可夫随机场方法,以笔划作为模型的隐状态,以笔划密度分布作为模型的观察量,将笔划之间的相互关系纳入到模型的参数之中,是一种融统计与结构方法于一体的识别方法.全文共分五章.第一章对汉字识别问题进行了综述,其中包括汉字识别的主要方法-结构与统计方法以及与方法相关的特征选取,回顾特征选择的发展过程,并指出隐马尔可夫随机场方法是结构方法与统计方法的综合,是一维隐马氏链模型的二维推广.第二章回顾了隐马氏链模型理论及应用算法,即隐马氏链模型的三个基本问题-识别问题,解码问题,学习问题以及与之相应的前后、后向算法,Viterbi算法,BW公式,引出相应的名词,为二维模型提供了原型.第三章介绍了隐马尔可夫随机场理论及其算法.首先给出隐Markov Mesh模型的定义和基本性质,然后利用不完全数据参数估计方法-EM算法的思想给出模型的参数估计方法,指出在概率意义下参数估计就近似为相应的频率统计,最后针对隐Markov Mesh模型给出状态确定的一系列算法,该章为作者的实验系统提供了理论依据.介绍基于隐Markov Mesh模型的手写体汉字识别实验系统,该系统包括笔划提取、学习、识别三个大的模块,首先给出了笔划和特征提取方法,以游程特征的大小作为笔划分割的主要依据;然后给出系统的学习和识别算法,学习就是依据学习样本为每个字建立一个隐马氏参数模型,依据EM算法的思想进行学习,在模型隐状态和参数都未知的情况下,先给定状态初值以统计参数,反过来再以新的参数确定新的状态,如此迭代直至收剑;识别过程首先根据游程特征统计进行粗分类,得到粗分类候选集,计算待识样本在每个粗分类候选集模型下的概率,以此概率为待识样本和模型的相似度,以相似度最大作为识别结果;最后列举出初步的实验结果和结果分析,实验表明,隐Markov Mesh方法在手写体汉字识别中是有效的.