论文部分内容阅读
汉字图像识别是模式识别研究与应用领域的一个重要分支,在经济贸易、智能交通、文字印刷等许多领域有着极其广泛的应用。因此,汉字识别方法的技术研究与开发越来越受到人们的重视,现今已经成为世界范围内热门研究的课题之一。随着深度学习在人工智能领域中的快速发展,深度学习中的卷积神经网络已经在模式识别中获得了优秀的识别性能。针对传统汉字识别受特征提取方法的限制,深度学习中的卷积神经网络便发挥了可以自动获取学习样本特征的优势,但是深度学习在训练样本时比较复杂所以难度较大。本文通过结合卷积神经网络以及传统模式识别在汉字识别的应用进行了相关的研究,论文主要研究工作如下:1)本文研究了传统汉字图像识别方法,使用支持向量机加决策树作为分类器,分别使用方向特征、Gabor特征以及弹性网格特征加上三种不同的数据集预处理方法进行试验。实验表明使用形态学转换的数据集预处理方法加上使用弹性网格特征,能够获得较好的识别准确率。2)为了解决形相似汉字的微小差异会在训练中丢失的问题,通过将注意力层与本文选定的AlexNet网络中的卷积层进行并联,以提高汉字图像中微小差异处的权重,达到提高该处注意力的目的,从而减少卷积层对于丢失信息的影响,提高识别效果。3)在实现汉字识别系统的过程中,对数据增强进行了研究,实验表明数据集通过合理的数据增强方法扩充后,能够有效地避免深度卷积神经网络的过拟合问题。4)结合了数据增强方法以及数据集预处理方法的研究结果,通过对不同结构的卷积神经网络进行试验。其中,使用数据增强+形态学转换+集成注意力层的AlexNet的方法识别汉字的准确率为99.87%,说明本文的方法在汉字识别上的应用是有效的。5)将传统图像识别中的特征提取与卷积神经网络结合,将弹性网格特征图作为卷积神经网络的输入,可以在减少卷积层的同时提升识别效果,从而优化了网络性能。