基于CNN-RNN框架的脱机手写中文文本行识别模型及其加速和压缩方法的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wudingyong2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写中文文本行识别一直以来都是学界的研究热点。因为书写者书写风格多样,字符类别数目庞大(超过7000类),以及字符之间的连笔等情况的存在,给脱机手写中文文本行的识别工作带来了困难。对于这些问题,提出一种数据规范化的方法是自然且重要的。随着深度学习方法的兴起,研究者逐渐放弃基于切分的传统方法,而转向使用基于无切分的深度学习方法来解决脱机手写中文文本行识别的问题,因为后者更加实用和鲁棒。但是深度学习方法有两个缺点,一是训练模型所需数据量大,二是模型的计算量和存储量较大。针对脱机手写中文文本行识别的困难和深度学习方法的不足,本文的主要工作和贡献为:1.提出了一种数据预处理和数据增强的方法,以及一个新颖的CNN-ResLSTM文本行识别模型。前者的提出是为了解决脱机手写中文文本行的书写风格多样化,文本行文字易产生倾斜、扭曲等问题,并通过随机生成训练样本,训练样本字符随机打乱,合成样本混合训练等操作产生足够多的训练数据,以对CNN-ResLSTM模型进行充分的训练。在模型的后处理部分,本文使用了语言模型进行解码纠错得到最终的识别结果。实验数据表明,本文所提出的方法取得了目前文献公开报道结果中最高识别准确率(CR92.13%,AR 91.55%),并且对于书写者的不同书写风格具有较好的鲁棒性。2.对于上述CNN-ResLSTM模型,由于其计算量和存储量都较大,不便于将其部署到移动端上,因此本文采用了一些方法对其进行了加速和压缩的工作。对于CNNResLSTM模型中的卷积层,LSTM层和全连接层,本文分别使用了Tucker分解和SVD分解的方法进行加速,并起到一定的模型压缩作用。进一步,本文使用了所提出的自适应剪枝算法对分解模型进行进一步的压缩,取得了压缩21.8倍,理论加速3.7倍,实际加速2.2倍的结果。最终压缩模型的存储量为2.8 MB,计算量为4.46 GFLOPs,达到了端上部署的要求。值得一提的是,本文的压缩模型的识别准确率仍然是目前文献中最高的。
其他文献
我国有着源远流长的传统文化,在这悠久的历史长河中,衍生出了种种带有独特意蕴的文艺元素,这些文艺表达都有着一个十分显著的特点,就是在不同的历史时期,都带有着当时社会文
语文是最重要的交际工具,是人类文化的重要组成部分。工具性与人文性的统一,是语文课程的基本特点。语文课程应致力于培养学生的语文素养。语文素养是学生学好其他课程的基础,也
目的观察腹针结合康复训练治疗产后腰痛的临床疗效。为产后妇女提供更有效的健康调理方法。方法选择96例符合产后腰痛的患者并随机分成3组,康复训练组实施康复训练,腹针疗法
古人将紫砂泥比作珠玉,足见其珍贵非常,用紫砂泥制作的茗壶茶器更是有着一种与生俱来的珠玉气质。紫砂壶“玉琮”就是一件从传统玉文化中汲取灵感,进而展开设计构思的作品。
目的 超声检查观察外伤性脾破裂自体脾组织移植术后的声像图变化,了解移植脾组织的存活情况。方法 33例自体脾组织移植患者,自术后第7天起,均行超声检查,监测脾组织的存活情况。
《关学学案》是民国时期陕西著名学者党晴梵先生的重要遗著之一,但由于该著作至今未刊行面世,故学界知之甚少。经作者搜求,发现该著作现有缮写本和剪贴本两个未刊藁本。通过
在发动机排放试验台上,对一台天然气发动机按照国六排放标准和国五排放标准分别进行了WHTC循环试验和ETC循环试验,进行了气体污染物排放的比较研究。结果表明,WHTC循环条件下
介绍了用 SE-52毛细管柱气相色谱、FID 检测器,以癸二酸二辛酯为内标的氯菊酯定量分析方法。本方法成功地分离了氯菊酯的顺、反异构体。测得方法变异系数为0.45%,氯菊酯顺、
目的:分析CAG方案治疗急性髓系白血病效果及对患者预后的影响。方法:选取2016年2月~2018年2月收治的急性髓系白血病患者68例,根据治疗方式不同分为对照组和观察组,各34例。对