手写体汉字识别的研究

被引量 : 0次 | 上传用户:zhzh06014201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字识别的研究工作一直被看作是具有重要理论意义和实践价值的模式识别问题,并被视为字符识别研究的最终目的。由于汉字类别多且字形结构复杂、汉字集合中相似字较多以及因不同人书写风格的差异造成手写汉字的变形很大,使得脱机手写体汉字识别最为困难。目前,脱机手写体汉字识别技术还处于研究发展阶段。 本文针对脱机手写体汉字识别技术的难点,综合运用数学形态学和小波变换等数学手段,针对脱机手写体汉字的特点,从仿人识字的角度出发,研究机器识字问题。 论文的主要工作如下: 1) 手写体汉字图像预处理。以特定六边缘点跟踪法提取手写体汉字笔划宽度,以数学形态学方法将手写体汉字进行宽度归一化,获取笔划宽度一致的汉字图像。可有效减小手写体汉字变形程度。 2) 手写体汉字笔划提取方法。基于数学形态学方法,给出了手写体汉字横、竖、撇、捺的提取方法,并且运用八邻域排除法对于提取出的四个方向的笔划进行修正,使得横平、竖直。 3) 手写体汉字的重构。提出了一种手写体汉字图像重构方法。运用横、竖、撇、捺笔划图像分/合/交判断叠加法,重构出近似印刷体的汉字图像。再运用八邻域排除法去除叠加图像笔划交点处的毛刺,可获得原汉字图像的基本结构信息。 4) 手写体汉字识别算法。依据提取的手写体汉字笔划获得横、竖、撇、捺四类笔划数量特征,根据重构的手写体汉字图像提取二维小波变换特征,并以同样的特征提取方法建立标准印刷体汉字特征库,给出了手写体汉字与标准印刷体汉字特征匹配识别算法。该方法能较理想地消除手写体汉字的变形,提高手写体汉字识别率。 实验仿真表明:基于笔划宽度归一化和笔划提取叠加重构的方法能够完整地保持原手写体汉字的结构特点,有效地消除手写体汉字的变形。双重特征提取方法能够有效地表征汉字图像的基本信息。手写体汉字与标准印刷体汉字特征匹配识别算法能较为准确地识别手写体汉字。
其他文献
CDN是一个建立并覆盖在互联网、由分布在不同区域的节点服务器群组成的虚拟网络。CDN采用缓存、复制、负载均衡和客户请求重定向等技术,将信息资源推向网络边缘,使得客户可以
[目的] 慢性阻塞性肺疾病(COPD)是以不完全可逆的慢性气流阻塞为特征的疾病,气流阻塞通常是进展性的,并与吸烟或吸入有害物质而引起的肺组织异常的炎症反应有关。本实验通过
通过理论推导,给出了最小偏向角的表达式,测量得到最小偏向角的具体数值.实验结果表明,用最小偏向角法测量的波长较对称法更准确,另外,光栅常数也是影响实验误差的原因.
本文首先提出了一系列问题:为什么住宅产业化在实业界没有获得支持?中国住宅产业化应该选择什么途径?推进住宅产业化的关键性步骤在哪里?本文运用了微观经济学的成本-收益理
双边投资协定作为国际投资协定的主要形式之一,自20世纪90年代以来取得了长足的发展。通过对这一时期双边投资协定发展趋势的研究,发现双边投资协定在数量快速增长的同时,形
招投标机制作为社会资源合理配置,降低社会生产成本及完善市场交易规则和促进市场体系发育和完善的有效手段,它的迅速发展是市场经济发展的必然选择。但是,由于湖南省建筑市
烷基酚环氧乙烯醚(APEOs)是一种重要的非离子表面活性剂,广泛的运用于工业生产中,然而它的代谢产物,尤其是壬基酚(NP)和辛基酚(OP)近年来被证实具有明显的雌激素效应。另外一
山东华宇职业技术学院经过三年的快速成长,已经成为德州地区数一数二的职业教育院校,学生数量达万人。但随着职教行业门槛降低,各院校竞争的进一步加剧,山东华宇职业技术学院
工业化与城市化协调发展一直是学术界讨论的热点问题。近年来各国特别是发展中国家都在大力推进城市化进程,快速城市化成为发展中国家的首要任务。对于发展中国家来说,以工业
本研究以初一、初二、高一、高二104名中学生为研究对象,考察了不同类型音乐对有无背景音乐偏好被试阅读理解成绩的影响。得出如下结论: (1)不同类型背景音乐对阅读理解有不