论文部分内容阅读
本文围绕手写体汉字识别研究的难点,从结构识别方法、统计识别方法以及神经网络识别方法三个方面对手写体汉字识别进行了综合的研究,主要工作包括:1、手写体汉字样本库的收集和建立:收集了近300套手写体汉字样本,每套样本含国标一级字库及数字、英文字母、标点符号共3849个字符,并建立了比较完整的字库管理系统。2、手写体汉字识别的结构方法的研究:在对汉字笔划、笔段进行分析和提取的基础上,提出了两种基于笔段匹配的结构识别方案:a、相容松弛匹配法:应用相容松弛匹配法进行了手写体汉字识别的研究,以汉字笔段作为基元给出了松弛匹配法中相容函数的构造方法。b、可变形弹性匹配模型:尽管手写体汉字书写风格变化繁多,但不同书写风格所写出的手写汉字的拓扑结构是不变的,基于这一假设,本文提出了一种可变形弹性匹配模型来进行手写体汉字识别,在该模型中,手写体汉字被认为是一种可变形的弹性模式,进行匹配时,两个汉字在保持其拓扑结构不变的前提下可进行笔段的弹性变形,从而寻求理想的匹配。3、统计识别方法:利用统计模式识别的经典方法——Bayes分类方法来进行汉字识别的研究,特征提取是统计模式识别的关键,本文着重围绕手写体汉字的特征分析和提取方法进行了研究,提出了三种特征提取的新方法:a、两种改进的结构特征提取方法:在笔划密度特征和外围特征的基础上,结合手写体汉字的特点,提出了加权非均匀笔划密度特征、加权非均匀外围特征的特征提取新方案;b、一种新的统计特征提取方法——弹性网格方向分解特征,根据汉字方块字的特点及笔划分布的统计特征,对手写体汉字进行横竖撇捺四方向的分解,并利用一系列的弹性网格对汉字分解后各分量的象素进行统计而提取特征,实验证明该特征提取方法用来进行手写体汉字识别是十分可行和有效的。4、神经网络识别方法:神经网络是近年来兴起的一个研究热点,本文在一个最新的神经网络计算机集成模拟环境——SNNS中对神经网络模型在手写体汉字识别中的应用进行了初步的研究,主要工作包括: