中文连续手写识别中若干问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：kmyzkmyz

【摘要】

：

中文连续手写识别是利用计算机对输入的中文手写文本信息进行自动识别,提取出相应的文字内容。在随着以人工智能等为核心驱动力的第四次工业革命到来,手写识别在许多人机交互

【作者】

：

汪子锐

【出处】

：

中国科学技术大学

【发表日期】

：

2020年01期

【关键词】

：

中文连续手写识别隐马尔可夫模型卷积神经网络状态绑定写字人自适应结构与知识蒸馏

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文连续手写识别是利用计算机对输入的中文手写文本信息进行自动识别,提取出相应的文字内容。在随着以人工智能等为核心驱动力的第四次工业革命到来,手写识别在许多人机交互场景中都扮演着重要角色:如快递自动分发、智能阅卷、信息录入等等。特别地,我们国家人口众多且在世界上占据越来越重要的地位,研究中文这种特定的文字识别就显得尤为重要。然而相对于孤立字识别而言,连续文字识别隶属于序列求解问题的一种,如何进行有效建模本身就是研究的一个难点。自20世纪以来,研究者们便基于统计建模的方法提出了许多解决思路。这些方法按照是否需要对图片进行显示地预切分可以分为过切方法和非切分方法。一方面,准确地寻找分割点往往成为过切分方法的性能瓶颈;另一方面,受限于传统分类器的表征能力,不同方法的识别性能一直没有取得很大的进展。近年来,随着可利用的海量数据的获得以及深度学习技术的突飞猛进,无论对以预切分为代表的过切法还是对无显示分割的方法,连续手写识别的性能都有了极大的提升。尽管基于深度学习的已有方法相比传统方法获得了明显性能的改进,但是仍然有一些值得进一步研究的地方。第一是如何将传统序列模型与深度学习技术更有效结合来实现对训练数据,特别是大量孤立字符数据的充分利用;第二是中文字符本身种类繁多、相似度高,如何通过数学模型来自动侦测、聚类这些字符间的相似基本单元从而提高神经网络的建模能力以及减小解码器在字符识别中的模糊性问题;第三是考虑到写字人在无约束书写环境下千变万化的书写风格,如何利用自适应技术来实现写字人自适应,进一步提升识别性能;最后,如何通过设计更紧凑的网络模型,实现高类别数下的低存储消耗、低运算量分类器。因此,针对中文连续手写识别问题中的以上几点挑战,本论文研究新的解决思路。值得一提的是,针对某些问题所研究的新方法具备一定普适性,可以自然扩展到其他领域。首先,针对以往主流序列模型中分类器能力有限、训练集数据利用率不足的缺点。本论文提出运用神经网络和隐马尔可夫模型相结合的方式来处理中文连续手写文本识别。本论文从特征提取、分类器设计、训练准则、语言模型选择四个方面详细讨论所提出方法的有效性。基于隐马尔可夫的建模方法能充分利用训练集的孤立字符样本,提高数据利用率,缓解训练集中连续文本行不足带来的压力。同时,结合建模能力强的神经网络分类模型和语言模型,识别率可以优于其他主流方法。其次,在前一个研究搭建的最优系统基础上,针对中文字符类别多、相似度高的问题,本论文引入状态绑定技术将中文字符中相似部件聚类,从而减少总的状态数,提高卷积神经网络的可训练性和区分能力以及降低解码过程中因相似部件得分不一致带来的解码歧义。针对写字人风格多变的难点,通过在卷积神经网络中引入自适应层,将状态绑定与无监督自适应技术结合,降低写字风格带来的性能损失,使得识别性能能够进一步提升。进一步地,为了降低前述自适应技术带来的时延问题,本论文提出一种新颖的基于辅助的写字人风格抽取网络,通过将提取到的风格信息导入基线识别网络,实现快速自适应的目的。最后,针对高类别数的卷积神经网络存储消耗大、计算量高的缺点,本论文提出一种结构与知识相结合的蒸馏流程。所提出的方法,通过结构分析、紧致卷积开发、知识蒸馏三个环节的有机结合,在性能基本不损失的前提下,有效构建了一个更加紧致的分类模型。该方法不仅在本论文关注的中文连续手写识别任务中得到较好应用,也在其他主流分类模型、任务上得到较好的验证。

其他文献

钢筋混凝土筛分破碎厂房振动分析及控制研究

筛分破碎厂房是工业生产系统中一类重要的建筑物,广泛应用于煤炭、冶金等行业。随着我国选洗煤产业的发展,为满足生产要求,筛分破碎厂房不断引进国外大型动力设备,设备扰力也

学位

结构声强振动传递动力测试时程分析振动控制TMD阻尼器

以创建模范机关试点为契机大力推动机关党的建设高质量发展

2019年7月,习近平总书记出席中央和国家机关党的建设工作会议并发表重要讲话。这在党的历史上是第一次,充分体现了以习近平同志为核心的党中央对中央和国家机关党的建设的高

期刊

机关党的建设使命任务习近平总书记习近平同志机关党建工作国家机关工委高质量发展

高速铁路弓网拉弧致使行车电气量波动研究

随着高速铁路运输向高速化、重载化方向发展,重联动车组大量投入运营以满足铁路运输经济指标及乘客对运输时效性的迫切需求。重联动车组运行速度的不断提升,使受电弓的运行速

学位

高速铁路弓网拉弧双弓网耦合系统接触压力电气量波动

我国自愿紧急救助制度研究

近几年见危救助反被诬、“救不救”、“扶不扶”等成为社会热点问题。见死不救而引发的悲剧不断发生,究其原因,不仅是社会诚信道德的滑坡,也是由于我国对救助者权益保护的立法缺失。2017年3月15日颁布的《中华人民共和国民法总则》第184条首次以正式法律条文的形式规定因自愿实施紧急救助行为造成受害人损害的,救助人不承担民事责任。此条款具有积极的时代意义,被称为中国的“好撒马利亚人法”。自愿紧急救助这一单一

学位

自愿紧急救助好撒马利亚人法豁免权比例原则

五神针联合头皮针治疗脾肾虚弱型小儿脑瘫的疗效及对脑血流动力学影响

目的:探讨五神针联合头皮针治疗脾肾虚弱型小儿脑瘫的疗效及对脑血流动力学影响。方法:选取我院收治的脾肾虚弱型脑瘫患儿110例,采用随机分配原则分为两组,各55例。对照组给予头皮针疗法,主穴:百会穴;配穴:足运感区、运动区、语言区、平衡区和感觉区。治疗组在对照组基础上给予五神针,取穴为百会穴和四神聪穴,两组患儿均接受4周治疗。对比治疗后的临床疗效、DQ评分、GMFM评分及脑血流动力学指标水平。结果:经过治疗后,对照组显效27例,有效19例,无效9例,总有效率为83.64%(46/55),治疗组显效32例,有效

期刊

脾肾虚弱型小儿脑瘫五神针头皮针脑血流动力学

基于深度学习的铁轨损伤图像分类研究

铁路是我国交通运输的大动脉,加强铁路维护、保障铁路运输安全一直是国家关心和关注的问题。其中,铁轨损伤的检测和分类是铁路维护中的重要一环,要根据铁轨损伤的严重程度采取相应的维护措施,本文解决的是铁轨损伤严重程度的图像分类问题。传统图像的分类一般按照提取特征、重塑特征、分类器分类的步骤进行,本文使用的传统图像分类方法中,提取的特征有HOG特征、SIFT特征、LBP特征,重塑特征使用的是词袋模型和K-m

学位

深度学习卷积神经网络图像分类铁轨损伤

论党的创新理论入脑入心的有效途径和改进思路

习近平新时代中国特色社会主义思想是当代中国马克思主义、21世纪马克思主义,是中国共产党的精神旗帜,是国家政治生活和社会生活的根本指针。用党的创新理论武装全党、教育人

期刊

党的创新理论入脑入心习近平新时代中国特色社会主义思想改进思路有效途径

核电站专用工具自主化运维项目中的备件库存优化管理

提高核电运行管理水平是提高核电站经济性,保障核电站安全性的重要环节。缩短大修工期、延长发电时间是提高机组设备平均利用率的主要方法。专用工具是核电站维修的一大载体,直接影响着维修质量和工期,部分还影响到核安全。另外,专用工具的操作和维修将消耗大量的运营成本,其中备件成本又是占运营成本的主要部分。核电站专用工具的自主化运维项目中备件的管理是影响项目成本的主要因素。备件如果储备过多,生产容易保证,但占用

学位

库存备件可靠性优化

汉代石室墓初步研究

本文的研究对象是汉代石室墓。通过对中国两汉时期石室墓的墓葬形制等进行类型学划分,并根据已经收集的资料,将石室墓在两汉时代的发展结合分为5个时期。在各个时期内,对石室

学位

墓葬形制墓园文化因素

供电网络营配贯通项目质量核查管控系统设计与实现

项目质量核查管理信息化的重要组成部分是以科学管理为核心的营调贯通项目质量核查。通过项目质量核查管理,提高了电力公司数据核查效率。因此,课题利用了MVC技术、Eclipse技

学位

营配贯通数据质量核查管理系统测试

中文连续手写识别中若干问题研究

与本文相关的学术论文