基于MRFs的手写汉字识别研究

被引量 : 0次 | 上传用户:liongliong443
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写汉字识别是人机交互智能接口的重要组成部分,对于实现办公自动化、提高计算机的输入效率具有重要意义。由于汉字类别数量大、结构复杂、相似字多、书写风格多样等原因,手写汉字识别一直是模式识别研究领域的难点之一。马尔可夫随机场(Markov Random Fields, MRFs)将上下文限制条件整合到概率论中,在计算机视觉中得到成功应用。受此启发,本文研究了MRFs在手写汉字识别中的应用。通过研究MRFs在复杂性和不确定性问题中的应用,提出了一种基于MRFs的手写汉字统计结构模型,基于此模型研究MRFs在手写汉字识别中的应用。与传统手写汉字模型相比,提出模型的优势有:(1)多笔画特征。将汉字同一笔画根据不同笔画提取结果表示成模型的多个节点,巧妙地处理了笔画提取过程中由于书写风格差异、结构复杂等特点造成的不确定性。(2)模型拓扑结构自动形成。与传统采用监督方式初始化模型拓扑结构相比,提出的模型在训练过程中根据邻域系统自动形成拓扑结构,方式更简单。在模型匹配阶段,针对MRFs后验能量函数最小化问题,本文提出了对特征节点进行模糊标记以及对能量函数分阶优化的策略,提高了模型匹配的效率。针对HCL2000字库中前50个汉字类别的识别实验表明,提出的手写汉字识别方法识别正确率达到90.88%,对部分结构复杂汉字正确率可达96%,充分说明了本文方法的有效性。在笔画提取过程中,为了保持汉字图像笔画连接,提出了一种细化改进算法。通过重新定义原算法中保持连接的限制条件,增加了细化算法对于手写汉字图像的适应性。实验表明,细化效果得到了改善,算法应用到手写汉字识别中正确率提高了8.68%。针对基于Gabor滤波的传统笔画提取方法中,Gabor滤波器参数设置复杂、图像模板运算量大的问题,本文提出了一种综合细化和Gabor滤波的笔画提取策略,利用快速的细化算法减少Gabor滤波器的计算量。实验显示,Gabor滤波器的计算量降到了原来的6.72%。另外,针对常用的手写汉字特征提取方法在后续线性区分分析(LDA)特征变换中,不利于发现相似汉字细微区分信息的不足,提出了一种基于2DLDA变换的手写相似汉字特征优化方法。将传统的手写汉字特征提取和LDA变换表述为像素级特征的二维特征矩阵优化问题,利用2DLDA变换进行手写汉字特征矩阵的优化。实验表明,使用优化后特征对相似汉字的识别错误率降低了48.86%。
其他文献
<正>从媒体披露的一些大案要案中我们发现,有些干部在提拔任用前就存在贪污、贿赂等问题,但这些"问题干部"在提拔使用"体检"时,不但没有得到应有的处理,反而被委以重任,使之
本试验旨在证明样品水分含量,以及控制水分在10-11%条件下的氨基酸含量和粗蛋白含量呈正态分布与匀态分布对傅立叶近红外所建模型预测效果的影响。试验分别以豆粕水分含量、
半导体激光泵浦固体激光器是当前最重要、最热门的一个激光器研究领域。相对于其他种类的激光器,其具有效率高、寿命长、结构紧凑、输出稳定等显著优点。随着人们对激光器性
灯具在景观环境不断发展的今天,它的用途已经不再是单纯的照明,灯光还起到丰富景观色彩和营造环境氛围的作用。但是园灯作为环境灯光的载体,它的建设还是没有得到人们的足够
目的观察125Ⅰ粒子植入近距离放射治疗肺癌的疗效。方法回顾性分析我院2009年2月~2013年5月收治的肺癌患者120例,给予125Ⅰ粒子植入近距离放射治疗。术前采取治疗计划系统重
“依非韦伦”是世界卫生组织推荐的艾滋病抗病毒治疗一线用药,世卫组织指南迄今沿用的推荐剂量为每日600mg.据悉,该药从2005年起纳入中国免费治疗目录,目前约有26万名中国患
目的探讨重症肌无力的误诊原因。方法对我院收治并误诊的21例重症肌无力的临床资料进行回顾性分析。结果本组临床表现为声音嘶哑4例,吞咽困难、呼吸困难、复视各3例,言语含糊
<正>"逆城市化"这个概念是美国地理学家波恩在1976年提出来的。它指的是西方国家的"城市化"发展到一定阶段之后,人口增多、交通拥挤、环境污染等"城市病"越来越严重,大量城市
<正>时值"八一"建军节之际,以军旅生活为题材的电视剧在各个频道相继播出。其中,由侯勇、林永健领衔主演的电视剧《高地》一经播出,就受到了广大电视观众的热评。该剧以27师
期刊