基于隐马尔可夫随机场的手写体汉字识别方法及其实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:durrenchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文论述了脱机手写体汉字识别的隐马尔可夫随机场方法,以笔划作为模型的隐状态,以笔划密度分布作为模型的观察量,将笔划之间的相互关系纳入到模型的参数之中,是一种融统计与结构方法于一体的识别方法.全文共分五章.第一章对汉字识别问题进行了综述,其中包括汉字识别的主要方法-结构与统计方法以及与方法相关的特征选取,回顾特征选择的发展过程,并指出隐马尔可夫随机场方法是结构方法与统计方法的综合,是一维隐马氏链模型的二维推广.第二章回顾了隐马氏链模型理论及应用算法,即隐马氏链模型的三个基本问题-识别问题,解码问题,学习问题以及与之相应的前后、后向算法,Viterbi算法,BW公式,引出相应的名词,为二维模型提供了原型.第三章介绍了隐马尔可夫随机场理论及其算法.首先给出隐Markov Mesh模型的定义和基本性质,然后利用不完全数据参数估计方法-EM算法的思想给出模型的参数估计方法,指出在概率意义下参数估计就近似为相应的频率统计,最后针对隐Markov Mesh模型给出状态确定的一系列算法,该章为作者的实验系统提供了理论依据.介绍基于隐Markov Mesh模型的手写体汉字识别实验系统,该系统包括笔划提取、学习、识别三个大的模块,首先给出了笔划和特征提取方法,以游程特征的大小作为笔划分割的主要依据;然后给出系统的学习和识别算法,学习就是依据学习样本为每个字建立一个隐马氏参数模型,依据EM算法的思想进行学习,在模型隐状态和参数都未知的情况下,先给定状态初值以统计参数,反过来再以新的参数确定新的状态,如此迭代直至收剑;识别过程首先根据游程特征统计进行粗分类,得到粗分类候选集,计算待识样本在每个粗分类候选集模型下的概率,以此概率为待识样本和模型的相似度,以相似度最大作为识别结果;最后列举出初步的实验结果和结果分析,实验表明,隐Markov Mesh方法在手写体汉字识别中是有效的.
其他文献
随着现代高新科技的发展,板、壳等结构元件处于电磁弹性系统中的情况已是屡见不鲜,当没有机械约束时,系统至少存在一个不稳定的运动模态,而存在约束时,当电流和磁场达到某一个临界
科学与工程中的许多现象可以用微分方程来描述.随着计算机技术的发展,原来无法求解的偏微的方程反问题,由于其在产品设计、过程控制、物理特性识别等许多方面的重要应用,所以
广义线性模型在生物、医学、经济和社会学等领域有着广泛的应用,它适用于连续数据和离散数据,特别是后者。论文主要目的是研究广义线性模型(GLM)中部分协变量数据随机缺失时,模
该文研究了C中单位球B上的一些函数空间,得到了Dirichlet空间D的几个积分特征;在n>1的情况下研究了Dirichlet空间、α-Bloch空间,Q空间的关系,得到了它们之间的精确包含关系,
设D=7p,p为奇素数,关于不定方程x3-1=Dy2的整数解问题至今没有解决.本文主要利用同余式、Legendre符号、Pell方程的解的性质、递归数列方法证明了p=23,31时,不定方程x3-1=7py2仅
胡锦涛总书记在“三个代表”重要思想理论研讨会上的讲话中深刻指出:“相信谁、依靠谁、为了谁,是否始终站在最广大人民的立场上,是区分唯物史观和唯心史观的分水岭,也是判
该文研究ABS算法的误差分析.Abaffy(1987),Galantai(1987),Abaffy&Galantai&Spedicato(1989),Spedicato(1989)及Dixon(1997)等研究过这一专题.作者对这一专题,借鉴已有的研究
中共十六届四中全会通过《中共中央关于加强党的执政能力建设的决定》,在总结55年执政经验和规律的基础上,第一次把科学执政、民主执政、依法执政,作为执政党建设的目标之一