论文部分内容阅读
脱机手写体汉字识别是当前模式识别领域的研究热点之一,具有广泛的应用前景。由于手写体汉字笔划种类繁多、不同人的书写差异较大等因素的存在,特征选取及分类识别仍是手写体汉字识别中的重要课题。本文研究了变精度粗糙集理论相关概念方法与手写体汉字识别之间的关系,将手写体汉字图像的特征属性作为条件属性,汉字样本的真实属性作为决策属性,构建出了脱机手写体汉字识别决策信息系统。尝试采用变精度粗糙集理论中的特征约简和模型推理方法来研究解决手写体汉字的特征选取和分类识别问题。本文的主要工作如下:1.脱机手写体汉字识别决策信息系统的构建。从粗糙集理论的广义信息系统角度出发,将多种手写体汉字特征融合成一组多维手写体汉字特征向量作为条件属性,将汉字样本真实性先验知识作为决策属性,构建出一种手写体汉字识别决策信息系统。2.手写体汉字的特征属性约简。基于变精度粗糙集模型,给出了近似依赖度和互信息增量两种手写体汉字特征属性重要度的定义,设计出了手写体汉字特征属性的近似约简算法,能有效地对手写体汉字冗余特征属性进行约简。3.手写体汉字的容错识别。针对手写体汉字识别过程中存在的不确定性,提出了一种基于加权规则置信度的规则融合识别方法,给出了三种不同情况下的手写体汉字识别策略,提高了推理决策规则的泛化能力,减少了汉字的拒识率。4.手写体汉字识别实验。选取SCUT-IRAC手写体汉字图像数据库中25类共1000个手写体汉字图像样本,对文章研究的基于变精度粗糙集的手写体汉字识别方法进行了验证,实验结果表明,该方法是有效可行的。