脱机手写体汉字识别中细化、特征提取和相似字识别算法研究

被引量 : 0次 | 上传用户:xing_h0576
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与印刷体汉字识别相比,脱机手写体汉字识别具有书写风格众多、随意性较大、几乎无规律可循、复杂汉字难以识别等特点,并且由于手写变形的问题普遍存在,所以手写体汉字中相似字的区分比印刷体要困难得多。与联机手写体汉字识别相比,脱机手写体汉字识别不含任何实时信息。因此传统的细化、特征提取和相似字识别算法并不完全适合脱机手写体汉字识别,必须针对脱机手写体汉字识别的特性研究新的相关算法。本文主要工作如下:首先,针对当前汉字识别细化算法中存在的交叉点分离及笔段变短等问题,提出了一种基于字符边界的细化算法。算法每一步都针对单个的像素点作处理,并提取笔划单侧边缘点序列作为字符图像骨架。实验结果表明:该算法能较好地保留字符图像的基本信息,快速地去除字符图像中冗余的像素点,有效地解决了交叉点分离,笔段变短等问题,具有较好的细化结果,并为笔段的提取提供了有效的方法。在上述研究的基础上,提出了一种基于边界细化的笔段提取算法,算法的基本思想是利用基于字符边界细化算法初步细化后字符中部分复杂笔划已分解成笔段的特点,找出细化图像中的拐点、端点、断点;然后利用原图的连通关系把断开的基本笔段进行合并;最后进行笔段的提取。实验结果表明,采用该算法能有效地提取字符图像的笔段,并能取得较好的笔段提取效果。而后,为了提高相似字的识别率,分析了手写体汉字识别中相似字误识的成因,提出了一种新的相似字识别方法——基于特征点特征的部分空间算法。算法针对造成相似字误识别的各种原因进行了分析,得出了区分各种原因造成的相似字的特征必须满足的要求。通过对这些要求的分析,算法在进行特征点特征提取时,着重地讨论了特征点相关特征的提取,并引入端点对和断点对等概念,赋予了特征点更多的信息,以达到提高相似字识别率的目的。实验结果表明,在对相似字进行部分空间比较时,新算法提取的特征能较好地区分相似字。
其他文献
<正>如果说尼康AF-S DX17-55mm f/2.8G的出现树立了其在DX王国中的广角王座,而佳能EF 16-35mm f/2.8LⅡUSM将接过最佳全幅数码广角变焦镜头的桂冠,那么图丽AT-X PR016-50mm F
背景:近年来国内外均报道,抗乙型肝炎免疫球蛋白和拉米夫定在预防乙型肝炎、肝硬化肝移植后乙型肝炎的复发中取得了良好效果,但各大中心对于抗乙型肝炎免疫球蛋白使用剂量的
<正>每个人都有独特的天赋,"小宇宙"一日爆发,才华即全面展现。"你是摄影师还是机器人?你是创造新事物还是每天重复一样的工作?你是创意无限还是一成不变?你是享受生活还是怨
目的:研究中药饮片加成政策对浙江省公立中医医院发展的影响。方法:访谈、问卷调查及文献检索查阅等方法。结果:中药饮片是中医医院的特色和品牌,中药饮片的加成收入是医院收
网络银行已经成为银行业保留老顾客和获取新顾客的一种新兴的服务渠道,而有关顾客采用网络银行影响因素的研究也越来越激发兴趣,引起关注。感知风险和信任是网络银行顾客最为
目的:探究医护一体化管理模式应用于肾内科住院患者的感染预防管理中的效果。方法:以湖州市师范学院附属第一医院2013年3月~2014年3月收治的1260例肾内科住院患者作为研究对
本文以1999年至2003年的民营上市公司为研究对象,回避国有上市公司的非市场因素,研究股权结构、高管持股对绩效的影响。实证研究显示:第一大股东绝对控股时,其持股比例越高公
目的观察孕期个性化膳食指导和营养管理对妊娠结局及新生儿状况的影响。方法选取2012年6月至2013年12月来本院产科门诊进行产前检查的280例孕妇,参照随机数字表格法分为对照
<正>中央电视台新闻频道于2008年11月17日《朝闻天下》和中央人民广播电台"关于中国改革开放30年——文艺篇"中报道:改革开放30年是文化建设历史上非常重要的一个历史时期,文
研究目标:农业用水效率在区域层面的空间交互影响效应。研究方法:利用Global超效率DEA模型和全要素用水效率指标测度中国省际农业用水效率,并首次采用VAR框架下的脉冲响应函