论文部分内容阅读
脱机手写汉字由于其字量大、类别多、字形结构复杂、存在相似字和变形问题等,一直是模式识别领域中的研究热点和难点之一。由于传统识别框架“预处理+特征提取+分类器”近年来没有取得较大进展,同时深度学习方法为计算机视觉领域注入了新的活力,越来越多的人尝试用深度学习方法进行脱机手写汉字的识别工作。目前,一些常用的卷积神经网络被广泛用于脱机手写汉字识别,如AlexNet、GoogLe Net等,并取得了较好的识别结果。但是卷积神经网络只采用了交叉熵作为损失函数,并没有考虑到输入样本之间的类内距和类间距信息。本文提出将卷积神经网络和度量学习模块相结合的网络用于脱机手写汉字识别,在实现样本分类的同时,增大分类的正确率。本文的主要工作包括:1、提出了将GoogLeNet网络、ResNet网络分别和Triplet Loss度量学习模块相结合,形成GoogLeNet+Triplet Loss和ResNet+Triplet Loss两个新的网络结构,并将这两个新网络用于脱机手写汉字识别,得到了90.07%和97.07%的识别结果。Triplet Loss度量学习模块要求输入图像必须是三元组样本对,其中包括属于同一类的两个样本和不同类的一个样本。实验结果表明,如果三元组选择不合理,将会严重影响网络的识别精度;只有选择合理的三元组样本对,Triplet Loss才能有效地减小输入样本的类内距离、扩大类间距离,提高最终的识别结果。2、提出了将GoogLeNet网络、ResNet网络分别和Center Loss度量学习模块相结合,形成GoogLeNet+Center Loss和ResNet+Center Loss两个新的网络结构。将这两个网络分别进行脱机手写汉字实验,得到96.18%和97.03%的识别结果。实验结果表明,Center Loss度量学习模块可以有效地提高手写汉字识别精度。同时,Center Loss模块省略了构造样本对的要求,降低了计算复杂度。3、提出了将ResNet网络和基于余弦距离的Center Loss相结合用于脱机手写汉字识别,该方法有效避免了传统的Center Loss采用欧氏距离进行计算时丢失输入特征向量之间的方向信息的问题。本文将ResNet网络和基于余弦距的Center Loss相结合用于手写汉字识别,进一步提高识别率,最终取得了97.24%的识别结果。