基于深度学习的联机手写汉字分析与识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:y58141917
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写汉字根据采集方式分为联机手写和脱机手写,根据任务一般分为两大部分,包括手写风格分析和字符识别。随着触屏在生活、娱乐、教育等等场所的普及,手写汉字分析和识别的需求越来越大,成为模式识别领域的重要研究方向。手写风格分析包括手写者识别(笔迹识别)和笔迹鉴别,是重要的鉴权方式。手写者识别主要是识别单个字符或者句子的书写者;笔迹鉴别是判断某个字或文本是否为某人所写。手写汉字识别可以通过机器的视角理解手写的信息,包括单字和文本识别。手写文本行存在各种各样的风格,比如水平、重叠、竖直、倾斜文本等,但是目前几乎所有的手写文本行识别还是基于单独的水平或者竖直的文本行识别,对文本风格有严格的格式约束。围绕联机手写汉字的分析与识别,本文摒弃了特征设计难度大且正确率低的传统方法,主要通过探索深度学习在联机手写汉字领域的应用,研究了基于深度学习的联机手写汉字书写者识别和基于深度学习的无约束联机手写文本识别。具体来说,本文的工作内容和创新主要包括如下两个大的方面:1.针对基于深度学习的联机汉字手写者识别,本文研究了联合数据增强技术、Pathsignature特征与不同深度神经网络的手写者识别新方法。本文中提出的Drop Stroke(DStr)作为联机手写领域的数据增强方法,对模型的泛化性、鲁棒性和学习能力的提高做出了很大的贡献。本文中使用Path-signature特征作为模型的输入特征的一部分,更好的帮助模型进行特征理解。实验结果表明,使用本文提出的方法在CASIA-OLHWDB1.0数据库的手写者识别测试取得了较好的结果。2.本文提出了一种多层蒸馏门控递归神经网络模型。该网络包含了压缩层和递归神经网络层,加快训练速度的同时保证识别性能。本文提出一种数据增强方法,以合成逼真的手写数据集,其中包括水平、竖直、重叠、旋转、倾斜、和多行文本。我们通过合成联机手写文本行和无约束联机手写文本,解决了联机手写文本行数据量不充足和没有无约束联机手写数据集的问题。本文中的方法在无约束联机手写文本的识别上取得了不错的结果,并且在现有公开联机手写测试集ICDAR2013 Online Text Data的识别中取得了在未使用语言模型后处理情况下目前最高的识别率91.36%。
其他文献
高校“两课”课程的改革是时代的要求。“两课”的改革应在课程内容的主线、课程门类的设置、课程的教授方法上与时代紧密结合,与时代同步,实现“两课”向时代化、社会化和世界
原位电法热脱附是一种针对易挥发和半挥发性有机物污染场地的土壤修复技术,根据加热方式可分为电阻加热和热导加热两类。本文结合欧美工程实例,阐述了原位电法热脱附技术原理
普通话水平测试过程中测试员主观心理的不稳定因素导致了评价上的误差。造成误差的原因是比较复杂的,本文从四个方面阐述误差的原因,为制定相关策略寻求依据。
通过正交试验方法优化釉料组成和烧成工艺,制备了R2O–RO–B2O3–SiO2–Al2O3–P2O5–CaF2多元系光亮无锆的分相–析晶乳浊釉。采用X射线衍射仪、透射电子显微镜/X射线能谱、
在食品安全问题日益引人关注的今天,越来越多的所谓“绿色食品”逐渐成为人们餐桌上的热门,引人相互追逐。在陕西省铜川市范围内.土鸡蛋的热销就是这种趋势的显著表现。而土鸡蛋
结合工作实践,从高校教学质量监控体系建设入手,对实施高校教学质量监控制度进行探讨,并提出了学校、系(都)、学生三级监控体系及具体实施方案。
我国农村土地制度改革试点取得初步成效。完善农村土地制度需要解决的四个问题,一是农村集体土地征收问题,建立"公共利益"认定程序,明确农村集体土地征收范围,建立科学的征地
运用材料力学、机械设计等相关理论验证了机床主轴常采用空心结构的可行性。
人工智能技术与行业融合带来了生产力的巨大进步。人工智能时代背景下,计算机辅助翻译可视为人工智能与翻译相结合的产物,是当前背景下翻译学习者、从业者无法回避的问题。为
采用X射线衍射、透射电镜和扫描电镜等测试手段,研究了不同组成对分相-析晶乳浊釉显微结构及釉面性状的影响。研究表明:B2O3和P2O5能促进分相形成,并且由于分相具有很小的表