论文部分内容阅读
手写汉字根据采集方式分为联机手写和脱机手写,根据任务一般分为两大部分,包括手写风格分析和字符识别。随着触屏在生活、娱乐、教育等等场所的普及,手写汉字分析和识别的需求越来越大,成为模式识别领域的重要研究方向。手写风格分析包括手写者识别(笔迹识别)和笔迹鉴别,是重要的鉴权方式。手写者识别主要是识别单个字符或者句子的书写者;笔迹鉴别是判断某个字或文本是否为某人所写。手写汉字识别可以通过机器的视角理解手写的信息,包括单字和文本识别。手写文本行存在各种各样的风格,比如水平、重叠、竖直、倾斜文本等,但是目前几乎所有的手写文本行识别还是基于单独的水平或者竖直的文本行识别,对文本风格有严格的格式约束。围绕联机手写汉字的分析与识别,本文摒弃了特征设计难度大且正确率低的传统方法,主要通过探索深度学习在联机手写汉字领域的应用,研究了基于深度学习的联机手写汉字书写者识别和基于深度学习的无约束联机手写文本识别。具体来说,本文的工作内容和创新主要包括如下两个大的方面:1.针对基于深度学习的联机汉字手写者识别,本文研究了联合数据增强技术、Pathsignature特征与不同深度神经网络的手写者识别新方法。本文中提出的Drop Stroke(DStr)作为联机手写领域的数据增强方法,对模型的泛化性、鲁棒性和学习能力的提高做出了很大的贡献。本文中使用Path-signature特征作为模型的输入特征的一部分,更好的帮助模型进行特征理解。实验结果表明,使用本文提出的方法在CASIA-OLHWDB1.0数据库的手写者识别测试取得了较好的结果。2.本文提出了一种多层蒸馏门控递归神经网络模型。该网络包含了压缩层和递归神经网络层,加快训练速度的同时保证识别性能。本文提出一种数据增强方法,以合成逼真的手写数据集,其中包括水平、竖直、重叠、旋转、倾斜、和多行文本。我们通过合成联机手写文本行和无约束联机手写文本,解决了联机手写文本行数据量不充足和没有无约束联机手写数据集的问题。本文中的方法在无约束联机手写文本的识别上取得了不错的结果,并且在现有公开联机手写测试集ICDAR2013 Online Text Data的识别中取得了在未使用语言模型后处理情况下目前最高的识别率91.36%。