论文部分内容阅读
随着人工智能的快速发展,汉字识别在信息录入与分析、办公室自动化等方面发挥了重要的作用。然而由于自然环境下采集的汉字样本具有复杂的光线纹理和不同程度的变形扭曲,所以使得自然环境下的汉字识别研究面临了巨大的挑战。现阶段通常采用的汉字识别方法是基于深度学习来实现的,而基于深度学习的方法在进行网络训练时需要提供丰富的汉字样本库。由于现有的汉字样本库存在样本数量少和样本单一的问题,如果采用现有的汉字样本库进行网络,就会出现过拟合的情况,同时训练出来的网络模型也难以在实际场景中得到有效的应用。由此可见,建立一个大规模并且具有代表性的汉字样本库是开展自然环境下汉字识别研究的前提与基础。由于采用的传统方法(例如扫描、拍照等手段)采集汉字样本,在人力物力以及时间成本上都面临着极大的开销,而且在汉字样本标定时的效率也十分低下。因此,本文提出了基于风格迁移与薄板样条的扩充汉字样本库的算法自动生成汉字样本。本文结合汉字识别的应用场景,重点对扩充光线样本的方法和扩充变形样本的方法进行了研究学习,最终提出了一种基于风格迁移与薄板样条的扩充汉字样本库的算法。本文完成的主要工作如下:1.针对自然环境中汉字识别受光照影响的问题,提出了通过扩充具有真实感光照纹理的汉字样本的方法,来减少光照产生的影响。本文结合汉字识别的应用场景,对扩充具有光照样本的方法还进行了研究,提出了采用图像风格迁移的方法生成具有不同光照纹理的汉字样本图像。图像风格迁移的方法是基于卷积神经网络实现的,首先,提取内容图像(汉字原图像)和风格图像(光照纹理图像)的特征向量,并计算它们的激活块;其次,对于每一个内容块计算最匹配的风格块;再次,将每个内容块与其最匹配的风格块交换;最后,重建完整的内容块得到风格化的图像结果,从而达到生成具有真实感光照纹理的汉字样本的目的。2.针对自然环境中汉字识别受图像扭曲变形影响的问题,提出了通过扩充具有不同程度扭曲变形的汉字样本的方法,来减少扭曲变形的影响。本文结合汉字识别的应用场景,对扩充具有不同程度扭曲变形的汉字样本方法进行了研究,提出了采用薄板样条变形的插值算法来生成具有扭曲变形的汉字样本图像。首先,在原图像和目标图像中采用SIFT特征匹配,得到两张图像匹配的N对特征点坐标;然后,通过薄板样条变形将原图像的N个坐标点形变到目标图像中对应位置,同时给出整个空间来实现汉字图像的形变;最后,达到生成不同程度变形和扭曲的汉字样本的目的。3.针对自然环境下汉字识别受光照和扭曲变形影响的问题,提出了通过扩充自然环境下的汉字样本的方法。本文结合汉字识别的应用场景,提出了基于风格迁移与薄板样条变形的算法,来生成更为丰富的、能够模拟自然环境下(光照、纹理、倾斜、扭曲变形)采集的具有真实纹理的汉字样本库。由于在采集汉字样本时光照阴影会随着拍摄角度的变化而变化,因此本文提出的扩充汉字样本的方法是先合成汉字纹理图像,再对汉字纹理图像变形,最终得到既具有真实感纹理又具有不同程度变形的汉字样本。采用上述算法模拟生成自然环境下的汉字图像,从而新建一个具有代表性的汉字数据集。4.采用相机采集自然环境下的汉字图像,建立一个小类别的汉字样本库。同时,采用上述算法模拟生成一个同样类别的汉字样本库,然后通过LeNet网络训练两个新建立的数据集。实验结果表明,本文提出的基于风格迁移与薄板样条的扩充汉字样本库的方法是可行的。不仅解决了自然环境下汉字样本不足的问题,同时还减少了光照和变形对自然环境下汉字识别效果的影响。