论文部分内容阅读
随着时代的发展,汉字字符的识别研究在文献数字化检索、邮政邮件分拣、银行支票处理、表格制作、基于手写的文本输入等相关领域有着广泛的应用前景而备受关注。传统研究方法主要通过“预处理+特征提取+分类器”的模式对汉字进行研究,但是由于字符识别本身存在着种类繁多、易混淆字符较多、结构复杂变化大等问题,字符识别的研究仍然存在着诸多的困难与不足之处,而卷积神经网络具有权值参数共享、特征提取能力强等优点,利用卷积神经网络技术可有效实现汉字的准确识别。本文主要对基于卷积神经网络的汉字识别技术进行研究,研究内容如下:(1).针对现有汉字数据库字符类别不全、字符特征变化少等问题,提出了一种基于字符编码的汉字字符数据库构建方法,可用于神经网络的训练与测试。该方法根据利用官方字库得到相应的所有字符信息,并利用字符编码输出相应的字符图片,为了扩增数据集,采用不同的字符编码输出得到不同的字体的字符图片,并且经过图像放缩、图像旋转、凸化变形、波纹扭曲方法对原始的字符图片处理得到汉字字符数据集。该方法能够实现脱机自行创建汉字字符数据库的目标,所创建的汉字字符数据库数据量大、字符类别覆盖全面、图像特征多样,具有良好的泛化能力。(2).针对现有神经网络特征提取能力差、计算量大等问题,提出了一种新的卷积神经网络架构,可用于汉字的识别。该网络由多个卷积层、池化层、批标准化层与Softmax回归层连接组成,并添加了 RMSprop优化器、数据扩增、批标准化等方式进行优化、提高了网络对汉字的识别准确率。同时针对网络过拟合问题,采用了正则化与Dropout方法,有效防止了网络过拟合。通过将其与经典的Alexnet、Lenet等神经网络模型进行实验对比,可以证明本文所提出的网络架构在汉字识别中提取特征能力强、识别准确率高。(3).针对现有神经网络优化方法复杂度高的问题采用了一种针对卷积神经网络的非对称卷积优化方法。该方法根据汉字识别过程中汉字的独特性质,不改变原有的神经网络架构,仅仅将部分卷积层与批标准化层以非对称卷积核构成的隐层进行了替换,利用非对称卷积核对于四邻域骨架信息的权值加强,去提取特征图像中的有效特征。通过与原网络模型进行实验对比,可以证明本方法在识别准确率、准确率方差上均优于原卷积网络模型,体现了非对称卷积核对卷积神经网络在汉字识别中的性能优化。