基于细化处理的脱机手写汉字识别研究

来源 :天津师范大学 | 被引量 : 4次 | 上传用户:robin3000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字作为一种世界上最古老,并唯一流传至今的形意文字,已有六千年历史了。作为我们日常使用的语言文字,其具有数量巨大,结构复杂,相似字多等特点,因此手写汉字识别体现了模式识别领域的最高水平,其中脱机手写汉字识别是目前最为困难也最具挑战性的研究课题。在办公自动化,机器翻译等方面,脱机手写汉字识别又有着广泛的应用前景。因此可以说对于脱机汉字手写识别的研究不仅拥有深刻的理论意义,更包含着巨大的实用价值。脱机手写汉字识别大致可分为:预处理、特征提取、分类器等几个主要步骤。本文针对这几步进行了深入的研究,主要工作包括:(1)预处理方面,利用均值滤波器实现了图像的平滑去噪,根据纸张来源不同采用了不同的处理方法完成了图像二值化。然后深入研究了倾斜校正,汉字切分,归一化等技术,并根据系统实际需要进行了相应处理,为后继的特征提取打下了良好基础。(2)通过回顾和总结几种常用的细化算法,并结合本系统的特点提出了一种基于SPTA细化算法的改进方法,达到了很好的效果。(3)按照特征提取的不同类别,全面比较了全局统计特征、局部统计特征,结构特征的优缺点,并在本系统中采用了弹性网格像素概率分布特征提取法。(4)分析了多种分类器的设计,并对BP神经网络在分类识别,学习训练等方面做了全面阐述。本课题在深入研究脱机汉字手写识别理论的基础上,开发了一套学生成绩自动处理系统。它属于小字符集手写汉字识别,这与传统的大字符集手写汉字识别有所区别,这也为该课题的成功实施提供了可能。在本系统中,通过建立一个包含“优、良、中、差”四个常用成绩手写汉字的样本库,对一些纸质成绩单进行电子扫描并机器识别,实现了学生成绩管理自动化,极大的提高了办公效率。通过对实验样本的测试,系统的正确识别率达到了96.25%,虽然这只是一个研究性模型,离实际应用还有一些差距,但是这方面有益的探索与尝试,为今后脱机汉字手写识别的应用研究提供了一定参考价值。
其他文献
说话人识别系统对纯净语音已经可以达到很高的识别精度,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降,因
在古代,住宅的采光和纳气均源自于大自然,因此古人对房屋的地理位置和朝向十分关心。但现代社会,人们可以使用家用电器改变室内的光气环境,所以不再完全依赖室外环境。如当室
汽车的生产制造是一个超大规模的复杂制造过程,其最基本的前提是汽车零件的制造。传统的汽车零件设计制造流程要求有产品的蓝图设计或其CAD模型,然而在很多场合下设计的初始
目前对BitTorrent网络的研究大都是在真实环境或模拟环境下进行的测试研究,因此从理论上分析系统中的核心算法,研究一下系统为什么采用这样的策略、采用这些策略后会对系统的
随着网络安全事件的增多和攻击行为的复杂化,入侵检测系统暴露出许多缺陷,如报警数据量大,重复报警多,误报率高,报警事件大多只对应于攻击过程中的单步动作,复杂攻击的表现能
课题以协同工作平台服务系统开发为背景,以工作流技术为指导,构造生产任务调度领域模型并优化其调度方法,旨在通过优化调度流程,从而提高调度的效率与资源利用率。同时结合面
随着网络化制造的迅速发展,制造企业间各信息系统需要更多的通信和交互,需要共享相关数据,共同合作来完成企业业务流程。而由于历史的及其他方面的原因,企业信息系统大部分是
随着专利文献类别和数量的迅速增长,专利管理系统急需解决快速文献分类及高效、高质的专利检索等问题。在传统的专利管理系统中,分类是系统的基本功能,也是影响系统性能的关
在特种电影的制作过程中,图像的畸变校正、拼接、融合一体化是一个重要部分。本文重点研究了一体化过程中的图像畸变校正部分。本文在总结已有的图像校正方法的基础上,提出了
超常介质是一种新型的人工合成材料,它具有许多自然材料所不具备的独特的电磁特性。随着超常介质从微波到红外甚至光波段的实现,对电磁学、材料学、光学、电子学、通信等学科