手写体汉字的计算机识别研究

被引量 : 0次 | 上传用户:chloexg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写体汉字计算机识别是模式识别领域最难解决的问题之一。在我们所从事的《计算机笔迹鉴别》和《网络化笔迹检索》项目的研究与应用中,经常需要从选定文稿中挑选出常见字以备鉴定,然而,从大段的手写文稿中挑选出所需要的字迹是一件繁琐的事情,工作量大、容易出错。为了提高软件的鉴别效率及实现软件的自动化、智能化,有必要对其中的手写体汉字实现计算机自动跟踪识别。手写体汉字的识别是尚未攻克的难题,相关的资料有限,在短期内试图完全解决这一难题是不大可能的。然而,本课题研究的是部分常用汉字的识别,与传统意义上的大数量集的汉字识别有所区别,这为该课题的成功实施提供了可能性。 本文的主要研究内容为:文字识别的原理和方法,汉字图像的预处理,汉字识别的分类算法,神经网络在汉字识别中的应用,常用汉字识别系统方案设计与开发。 文字识别的原理和方法介绍了文字识别领域采用的一般方法和策略——基于数学特征的统计决策法和基于结构特征的句法分析法。汉字图像的预处理包括对识别文稿进行平滑去噪、图像二值化、倾斜校正、行字切割、归一化以及细化。汉字识别的分类算法包括对汉字进行粗分类和细分类,在不同的分类方法中各采用两种互补的特征抽取算法,并相应地在识别上采用不同的策略。神经网络在汉字识别中的应用包括研BP神经网络及其改进算法、设计汉字识别所需要的BP神经网络,即在神经网络的输入层、中间层、隐含层采用64—20—4的结构,并利用Matlab6.5对所设计方案进行仿真和验证。 本项目在汉字识别领域最新成果的基础上设计并开发了三级识别策略的汉字识别系统。第一级,使用传统的外围特征法和投影变换系数法将待选字进行粗分。第二级,使用笔画密度特征和比画四分解的弹性扇形网格特征进行细分。第三级,结合当前最流行的BP神经网络算法对结果进行最后的确认,最终输出结果。 本系统采用Delphi6.0进行软件开发,对写字较为规范正规的手写体,其识别率达到98%以上(10候选),取得了令人满意的结果。
其他文献
钢纤维混凝土是近年来发展起来的一种新型建筑材料,是在普通混凝土中掺入适量的钢纤维而形成的可浇筑、可喷射成型的一种新型复合材料,除抗压强度外,它的各项物理力学性能都比普
黑格尔的戏剧美学思想植根于西方戏剧美学传统之中,是对自古希腊、罗马时期至德国古典时期戏剧美学思想的批判、继承、发展与创新,并结合其本人丰富的艺术欣赏实践与严密辩证的
本文依据理论模拟和实验对掺Yb3+双包层光纤激光器进行了一定的研究,对盘状光纤激光器的结构特点做了较为深入的探讨和理论模拟。主要包括以下内容:对掺Yb3+双包层光纤激光器的
本文通过声乐演唱中所涉及到的生理上的机理及有关器官生理动作的巧妙组合,探究声乐演唱中科学的生理机能运动,使声乐演唱的方法更科学、合理。此外,歌唱的整个过程离不开心理活
行政处罚以行政相对人的违法行为存在为前提,而违法行为的认定必须有充分、确凿的事实依据。证据制度及规则对于保证行政处罚的公正、有效是至关重要的。重视行政处罚证据的研
目的关节镜术中比较成人膝关节髌内侧滑膜皱襞和症状性皱襞的形态学特点,探讨滑膜皱襞综合征的诊治。方法210例成人患者施行关节镜术,155例膝关节存在髌内侧滑膜皱襞,其中38例确
21世纪,改革开放的中国进入了一个全新的繁荣昌盛时期。与此同时,中国农业本身的转型和WTO的外部环境交织在一起,因问题的严峻性和复杂性而备受关注。毕竟,能否正确抉择,对于13亿
随着市场经济的发展,我国金融经济的特征越来越明显,商业银行在国民经济发展中发挥着重要的核心作用,它影响着证券市场的运行、货币的数量、投资及国民经济的发展。但是,由于体制
近半个世纪以来,资本市场逐渐成为金融体系乃至整个经济运行的轴心。与此同时,资本结构的重要性使之成为现代金融理论研究的核心之一。上市公司的价值创造是资本市场健康发展的
贺绿汀(1903-1999)是我国近现代音乐史上杰出的作曲家、音乐理论家,他还是一位苦心孤诣培育人才的音乐教育家。纵观其一生的音乐事业,几乎都与音乐教育息息相关。围绕音乐教育,