论文部分内容阅读
手写体中文的自动识别是中文文档数字化的前提和基础,在历史文档识别、手写笔记转录等方面有着重要的应用价值。手写体中文具有书写随意、结构复杂、相似性强、数目众多、缺乏统一规范等特点,这使得其自动识别成为一个具有挑战性的问题。
本文首先分析了手写体中文自动识别领域的研究背景与意义,对国内外的研究现状做了综述;介绍了深度学习的基础理论知识、卷积神经网络的构成,以及常用的网络模型。
其次,论文在经典LeNet-5网络模型的基础上进行改进,提出了一种LeNet-II模型。利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像;特征融合后,可以丰富特征图像多样性,提升识别的准确率。利用经典手写体中文数据集进行训练,实现了3755类手写体中文字符,以及相关文本的自动识别。实验结果表明,基于LeNet-II模型的手写体中文识别方法,其收敛速度和识别准确率明显优于经典LeNet-5模型,也高于其它传统算法;此外,对6幅手写体中文文本的平均识别准确率达到97.13%,超出了人类表现。
池化计算在降维的过程中容易忽略掉某些特征信息,为解决上述问题,提出了一种基于注意力机制的手写体中文识别方法。在卷积神经网络模型的基础上,搭建了一种AT-CNN网络模型,利用注意力机制实现了网络层之间的信息交互,减少了因池化操作导致的信息丢失。通过在经典手写体中文数据集HWDB上进行实验,结果表明,本文方法的识别准确率可以达到95.05%,明显高于卷积神经网络模型,也高于其它传统算法。此外,设计了一种手写体中文识别GUI界面,便于用户进行实际操作。
最后,论文对本文工作进行了总结,并对未来研究方向作了展望。
本文首先分析了手写体中文自动识别领域的研究背景与意义,对国内外的研究现状做了综述;介绍了深度学习的基础理论知识、卷积神经网络的构成,以及常用的网络模型。
其次,论文在经典LeNet-5网络模型的基础上进行改进,提出了一种LeNet-II模型。利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像;特征融合后,可以丰富特征图像多样性,提升识别的准确率。利用经典手写体中文数据集进行训练,实现了3755类手写体中文字符,以及相关文本的自动识别。实验结果表明,基于LeNet-II模型的手写体中文识别方法,其收敛速度和识别准确率明显优于经典LeNet-5模型,也高于其它传统算法;此外,对6幅手写体中文文本的平均识别准确率达到97.13%,超出了人类表现。
池化计算在降维的过程中容易忽略掉某些特征信息,为解决上述问题,提出了一种基于注意力机制的手写体中文识别方法。在卷积神经网络模型的基础上,搭建了一种AT-CNN网络模型,利用注意力机制实现了网络层之间的信息交互,减少了因池化操作导致的信息丢失。通过在经典手写体中文数据集HWDB上进行实验,结果表明,本文方法的识别准确率可以达到95.05%,明显高于卷积神经网络模型,也高于其它传统算法。此外,设计了一种手写体中文识别GUI界面,便于用户进行实际操作。
最后,论文对本文工作进行了总结,并对未来研究方向作了展望。