基于深度学习的自然英文文字识别的研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:jieyses1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字作为自然场景中常见的信息承载形式,其中往往蕴含着丰富的语义特征信息,本文针对自然场景中的英文文字识别问题进行了研究。区别于传统OCR方法适用的文档图像等,自然场景下采集的文本图像往往存在着字体多变、排版不规律以及环境背景复杂等难点,为识别过程引入了诸多不定因素。如何让计算机能更精准无误地提取特征、识别文字一直是国内外诸多学者研究的热点问题。随着深度学习理论不断发展进步,其应用领域逐步扩展,在图像处理、预测分类等诸多方向上取得了不错的成效。本文以深度学习理论为基础,以自然场景下的英文文字识别为目标,以文字识别准确率及效率为标准,对场景下的英文文字的识别展开了研究。主要内容如下:(1)结合端到端的识别模型思想,在编码器-译码器框架下,设计了一套基于CNN-BiGRU-Attention的场景英文文字识别算法模型。从整体上将识别任务分解为编码以及译码两个流程,以此展开对各部分算法的研究与设计。(2)在编码环节中,在完成图像预处理的基础上,结合Jaderberg的卷积神经网络,给出了用于图像局部静态特征提取的卷积神经网络模型。为更进一步利用文字间上下文关联信息,引入双向循环神经网络以提取关联信息。同时,为进一步降低计算复杂度,采用门控循环单元作为其基本结构。在局部特征与关联特征提取工作的基础上,进而提出了上下文特征向量生成方式,从而实现了原始图像的特征编码。(3)在译码环节中,采取循环神经网络根据上下文特征向量进行解码,在这里引入了注意力机制以增强模型对上下文特征信息的应用,从而提升了整体正确率。结合本文研究数据的特点,对注意力机制进行了优化,提出了本文解码过程中所用的局部注意力机制,增强了局部关联特征的应用,并减少了整体计算量。在后处理阶段中,通过基于字典模型和基于n-gram语言模型的两种方法对集束搜索算法进行了优化,进一步提高了本文算法模型译码结果的准确程度。(4)在模型训练过程中引入指数衰减学习率、正则化以及滑动平均模型等方法,从效率以及识别准确率两个方面进一步优化本文的算法模型。在模型训练完成后,从多个方面测试了本文算法的效率、准确率以及泛用化能力。
其他文献
排列与组合的应用题是历年高考常见题型。本文针对解决排列组合问题,提出了"十六字方针,十个技巧",并作了分析。
<正>读者来信编辑:您好!我是深圳某实业公司新任的人力资源部经理,上任后不久,总经理对我说:“我知道你在薪酬控制上有一些独特的办法,请你在月底前提交一份预算报告,详细地
<正>能动德育是指激发学生自身主动性,促使其积极主动接受来自各方面的品德教育和人格熏陶,并最终形成完善的人生观和价值观的自我教育过程。养成教育是培养学生良好的行为习
随着经济全球化的发展和各国民商事交往的加深,国际民商事交往中的不平等因素逐渐凸显,国际私法中的弱者权益保护理念越来越为各国所接受并体现在立法当中。《中华人民共和国
<正>1994年1月1日凌晨,萨帕塔民族解放军在位于墨西哥东南部的恰帕斯州发动了游击队武装起义。导致萨帕塔民族解放军武装起义的原因是多方面的,但归根结底是因为当地印第安人
人的绩效表现和人的素质特征密切相关,越来越多的组织认识到仅仅依靠对工作本身的分析不能适应现代人力资源管理的要求。对人的素质的研究显得越来越迫切。素质模型的建立对人
本文通过热电偶传感器测温的原理分析了热电偶传感器的冷端补偿方法。
水资源污染是世界各国普遍面临的环境问题,其中含酚废水因毒性大,难降解而受到广泛关注。本文介绍了超声空化的原理及超声波在水处理中的广泛应用。选取酚类化合物中的典型物
本文采用缺氧-好氧连续式活性污泥反应器(A/O)模拟高盐废水进行试验,主要研究了高盐条件下,温度(18~30℃)对短程硝化反硝化的影响,尤其是低温(4~15℃)条件下短程硝化的实现途径
目的分析扬中市2010-2017年辖区内育龄妇女死亡情况,为制定有效的干预措施提供科学依据。方法收集2010-2017年扬中市育龄妇女死亡信息,对数据进行回顾性分析。结果 2010-2017