基于文本纠正及注意力机制的不规则自然场景文本识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是信息传递的主要载体,在自然场景中,文字经常携带着非常关键的信息,对于场景的理解起到了至关重要的作用,因此自然场景文本识别一直是一个非常有意义且备受关注的研究方向。在真实自然场景中,文本经常会呈现各种各样的形变,例如旋转、透视变形,弯曲排布等形变,这给自然场景文本识别任务增加了很大的挑战。本文针对自然场景中不规则文本的识别难题,提出了几个解决方案,能够有效改善自然场景文本识别系统的准确率。本文的主要研究工作和创新如下:1.通过系统分析现有不规则自然场景文本识别任务中存在的问题和相关解决方案的优缺点后,本文最终确定使用基于弱监督进行文本纠正的主体框架,在不需要额外数据标注的情况下提升自然场景文本识别的准确率。2.针对自然场景文字形变复杂多样且没有规律的难题,本文提出了一种基于序列变换纠正及注意力机制的自然场景文本识别算法(STAN),该算法由序列变换纠正网络和基于注意力机制的文本识别网络组成。其中,在序列变换纠正网络的设计中,本文引入了分解的思想来降低不规则文本的纠正难度,从而有效改善不规则文本的纠正效果。此外为了确保整个分解、变换再合并的过程是平滑变换的,本文在网络中设计了一个网格映射模块。然后文本识别网络接收纠正后的图片作为输入,结合注意力机制得到字符序列的预测结果。受益于弱监督的训练方式,整个网络只需要文本行标签就可以进行端到端地训练,并且使用序列变换纠正网络后识别准确率在一些不规则文本数据集上有超过5%的提升。3.考虑到基于几何变换约束的文本纠正网络会受限于几何变换的处理能力而不能灵活应对自然场景中形变较大且无规律的文本,本文提出了一种基于全局局部级联纠正及注意力机制的自然场景文本识别算法(GLCRAN),该算法由全局局部级联纠正网络和基于注意力机制的识别网络组成。其中在全局局部级联纠正网络的设计中,通过级联全局纠正器和局部纠正器,我们得到了一个灵活高效且容易优化的文本纠正网络。此外为了解决级联纠正过程中信息丢失以及多次插值采样造成的图片分辨率低的问题,本文针对性设计一个网格生成和采样策略,进一步完善文本纠正算法。该识别算法在多个公开的自然场景文本识别数据集取得了当前最好的识别效果,验证了该算法的有效性。
其他文献
这些年,随着汉语在世界上成为一门“热”的语言,汉语学习在喀麦隆也是不断地提高。而汉字教学在汉语学习中是一个很重要的部分,它是属于表意体系,与属于拼音文字体系的喀麦隆
给定两个图G和H,图G对图H的Ramsey数是指最小的正整数r,使得对完全图Kr的边进行任意的红蓝二着色总会找到红色的G或者蓝色的H.显然,根据图的Ramsey数的定义,存在一种对完全图
稀土元素的光、电等优良性能使其成为现代工业发展中的重要元素。稀土元素独特的电子结构使其在磁性材料、发光材料和荧光探针等领域得到了广泛的应用。由于宇称选律的限制,稀土离子中f→f跃迁概率小,而将具有高吸光系数的有机配体结合于稀土离子形成的稀土配合物,可以克服稀土元素本身的这一发光缺陷,有望得到具有明亮发光的稀土发光材料而得以应用。2,6-吡啶二甲酸不仅具有较强的紫外吸收能力,而且是一种在生物体内具有
本论文主要研究大气中两个重要有机物,苯甲醇和硝酸异丙酯在大气中降解的反应机理和动力学性质。(1)在密度泛函理论(M06-2X)和传统过渡态理论的基础下,对苯甲醇和OH自由基反应的机制和动力学进行研究。结果表明,当OH自由基从不同的方向靠近苯甲醇时,会形成六个由于范德华作用力而结合的复合物。然后OH自由基消除–CH_2OH基团和苯环上的H原子,或者加成到苯环的C原子上。所有的反应途径中,从–CH_2
新时代高校思想政治教育供需关系是指高校思想政治教育供给与大学生成长发展为“时代新人”需求之间的关系。对其进行研究,旨在发现存在于两者之间的供需冲突,并为协调供需关
长期以来,尼采哲学一直都备受众多学者关注。在尼采与宗教的研究领域内,多数研究成果仍是从尼采敌对基督的角度着手,对于尼采哲学与宗教关系的复杂性研究相对较少。实际上,尼采并非全盘否定宗教,相反,他对宗教仍保留着肯定的态度。尼采一生都深受基督教的影响,其哲学思想多多少少也会带有宗教性的特征。故此,本文依托基督教总结出宗教性的四个特征,分别为神性崇拜、超越性、全能性以及希望性。简略考察尼采对基督教的批判后
热红外成像技术因其能够非接触地、较为精确地捕捉肉眼不可见的温度差别,广泛地应用于工业生产,军事演练,日常生活中的方方面面。但是红外光具有反射性强、穿透力差、受环境
了解硅质岩地化的特征以及成因对于了解地区的沉积演化具有指导意义。本文通过对川西北地区文献调研的基础上,选取了野外的实测剖面和观测剖面、通过系统的采样对硅质岩样品进行薄片的观察、硅质岩的地化数据的处理分析,对川西北地区长兴组硅质岩的地球化学特征与成因进行分析总结与认识。研究主量元素特征结果最终证实,长兴组硅质岩中含有比较多的Al_2O_3,而Na_2O、MgO的含量并不高。相对来说,K、Ca、Mn、
随着国家、社会、科学技术的前进发展,国家及社会的人才需求变得日益庞大,高等院校是培养人才的担当者,因此,高等院校需要科学的管理,来提高教学质量,保障对国家、社会的人才
黄热病毒(Yellow Fever Virus,YFV)是黄病毒科(Flavivirus)的原型病毒,能够导致黄热病的发生。黄热病毒主要流行于南美洲、非洲的热带和亚热带地区,据估计,全球每年有80000至200000人感染黄热病毒,其中有30000至60000人死亡。由于缺乏对YFV与宿主相互作用的分子机制及其致病性的了解,临床上现阶段并无有效的治疗药物。黄热病毒-17D(YFV-17D)是黄热病