基于深度学习的自然图像字符检测

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:liongliong581
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景的字符检测包含两个阶段,即字符检测与字符识别。其中字符检测是对自然图像中单词或者字符行进行定位的技术;字符识别是紧接着对字符检测的定位结果进行提取,从自然场景图像中获取有价值的字符信息。如今深度学习的发展已驶入快车道,字符检测与识别的技术要求与应用需求也是水涨船高,基于自然场景中字符的字体、色彩、尺寸、形态和分布等特征,用传统方式很难对其进行合理拆分和提取。所以,如何合理地检测和识别自然场景尤其是复杂背景中的字符,是一项非常挑战性的工作。(1)通常情况下,自然场景中的字符分布杂乱无章,干扰因素繁杂,对字符的检测与提取造成了很大的困难。针对当前自然场景下字符检测算法性能上存在的不足以及复杂背景环境下的字符处理效率低下的问题,本文基于PSENet网络模型,结合特定模块设计了一种新型的像素级别字符检测方案,提升自然场景图像中的字符检测效能。首先,通过轻量化特征提取网络对图像进行关键信息的特征提取和特征融合,引入用以增强图像特征的U型级联结构;之后,对所获取的全部特征进行同级融合;最后,通过选择性搜索扩张算法对字符像素进行末端处理,确定字符所在位置。最终改进后的字符检测网络带来1.3%的精度提升,所以实验表明字符检测改进算法在改善冲突像素归属问题上有明显优势。(2)以往的识别网络中,字符排序随机性会对识别结果造成很大程度的干扰,针对以上问题,在基本的字符识别网络的基础上,首先,引入一个新的处理子网络即图像监督矫正,目的是对输入图像中的字符生成一系列控制点;其次,结合参考点的坐标对图像进行矫正,尽量消除因为旋转角度带来的影响;之后,使用CRNN网络提取字符图像的底层特征,Bi-LSTM存储特征的中层序列特征;最后,由CTC将特征序列转化为预测结果,并计算网络的损失。将改进后的识别网络在几个标准数据集上分别进行实验,验证监督矫正给网络带来的积极作用。实验结果表明矫正问题的解决给网络识别结果具有明显的帮助,在单字识别准确率上提升了1.64%。
其他文献
背景前交叉韧带是膝关节内最容易受损的韧带,也是膝关节重要的稳定结构之一。腱骨愈合是前交叉韧带损伤重建后治疗的关键,由于韧带重建后腱骨界面位置较深,传统的中频治疗型超声因衰减严重难以在骨道内产生充分的作用,无法有效促进前交叉韧带重建后的腱骨愈合。近年来,低频超声凭借其独特的性能备受瞩目。我们将低频超声作用于前交叉韧带重建兔模型来探究其对前交叉韧带重建腱骨愈合是否有促进作用。方法108只雄性兔接受前交
学位
背景:阿尔茨海默病(Alzheimer’s disease,AD)是一种隐匿起病、以逐渐进展的认知功能减退为主要临床特征的神经退行性疾病。AD是老年人最常见的一种痴呆类型,随着我国人口老龄化的加剧,AD的发病率逐年递增,给社会和家庭带来了沉重的经济负担。鉴于脑内淀粉样斑块的沉积和神经纤维缠结的发生是AD的重要病理特征,研究人员接连研发出多种以Aβ和tau蛋白为靶标的药物。随着多种治疗药物的临床实验
学位
脊髓损伤的具体损伤机制通常由两部分组成,第一部分是急性的原始物理损伤,包括压迫,挫伤,撕裂等,急性物理损伤会直接导致神经元轴突破裂,另一部分则是继发性损伤。原始物理损伤所引发的一系列二次级联放大的病理过程便是继发性损伤,例如氧化应激,缺血水肿,以及炎症反应。许多研究表明针对继发性损伤进行有效的治疗对脊髓损伤后的感觉和功能恢复有着重大的意义。进一步的说,对脊髓损伤后的炎症反应进行有效的干预措施可以促
学位
干细胞移植疗法是椎间盘退行性疾病的有效治疗手段。但是,椎间盘退行性疾病区域中活性氧含量的增加阻碍了人类脂肪干细胞(h ADSCs)移植后的治疗效率。过量的氧化应激(ROS)产物抑制了h ADSCs的增殖,并增加了细胞凋亡。在本研究中,我们设计了一种新型的两亲性共聚物PEG-PAPO,它可以自组装成纳米胶束并负载亲脂性Kartogenin(KGN)。这是一种可注射的酯酶反应性纳米胶束(PAKM),并
学位
停机位作为机场中极其稀缺和昂贵的重要资源,是实现航班快速安全停靠,保证航班之间有效衔接,提高整个机场系统容量和服务效率的一个关键因素。但随着国民经济的快速发展,停机位分配问题呈现出高维、多目标、多约束等复杂特征,致使传统优化算法已很难求解,以及求解效率不高等问题。因此,寻求高效、稳健的新智能优化算法来求解停机位分配问题,不仅具有重要的理论意义,还具有广泛的应用前景。协同进化算法是在进化过程中考虑子
学位
近年来,随着民航旅客运输量的逐年递增,各大空港综合交通枢纽不同程度出现到港旅客排队时间长、服务质量低等现象,空港综合交通枢纽传统的交通运力资源配置方式已经不能满足当前民航发展的现状,如何建立稳定、精确的到港客流短时预测模型成为实现空港综合交通精细化运营管理的关键问题,预测精度的高低直接影响了交通运力资源配置的效率与旅客出行的体验。本文对比分析了常见的短时预测方法,发现基于图卷积网络的预测方法更适合
学位
目的建立一种基于影响组学技术通过磁共振诊断肩袖损伤并预测肩袖损伤患者术后再撕裂发生可能的模型。方法为回顾性研究。共选择了101例肩关节磁共振无异常的患者和101例因肩袖损伤接受了肩关节镜下肩袖修补术的患者。通过勾勒目标区域,提取影像组学特征,筛选特征,构建模型的步骤,利用202例患者冈上肌的影像组学特征,建立了肩袖损伤的诊断模型。并根据101例接受手术的肩袖损伤患者的冈上肌、冈下肌、肱骨的影像组学
学位
飞行控制系统结构复杂,状态变量多且耦合性强,在工作过程中有较多干扰变量,难以建立精确的解析模型。而飞行控制系统的领域知识多存在于非结构化的文本信息中,因此构建飞行控制系统图结构化模型具有深远的意义。飞行控制系统实体与关系识别是构建图结构化模型的核心工作。本文以非结构化的飞行控制系统文本信息为研究对象,深入分析实体以及实体关系的特点,提出基于注意力机制的实体识别和实体关系识别算法,用于自动获取实体与
学位
脂肪来源的间充质干细胞(ADSCs)因其易获取和方便培养而成为修复椎间盘退变(IVDD)的种子细胞。然而,ADSCs向髓核(NP)样细胞定向分化的潜能有限,极大地阻碍了ADSCs在IVDD修复中的应用。越来越多的证据表明,细胞表面的官能团会影响干细胞的功能。因此,根据预期的治疗去设计和修饰细胞表面并赋予其功能是生物医学领域的研究中心。细胞表面糖代谢修饰能改变细胞的功能并可以规避许多基因工程修饰的不
学位
研究背景:骨缺损在临床治疗中一直是个难题。近年来,随着对人骨髓间充质干细胞(human bone mesenchymal stem cells,hBMSCs)的深入研究,发现促进其成骨分化可能是促进骨缺损愈合的有效策略。已经有研究报道睡茄素B可以通过抑制NF-κB信号通路从而抑制破骨细胞的分化,但其在hBMSCs成骨分化中的作用尚不清楚。本文对睡茄素B促进hBMSCs成骨分化的作用及其可能的机制进
学位