基于CNN和RNN的自然场景文本识别研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:foxgp123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于科技的快速发展以及智能设备的普遍使用,在自然场景中是检测并识别文本是一项具有挑战性的任务。随着社会对于场景文本检测与识别技术需求的不断增加,使得场景文本检测与识别可以广泛的应用到日常生活中。例如,应用于自动驾驶,可实时检测道路信息,应用于车牌定位,可快速的检测到车牌的信息,应用于视觉辅助,可帮助识别文本信息,帮助视障人士了解周围环境。传统的文本检测方法尽管已经趋于成熟,但大多数传统方法直接应用于背景单一的图像或者是合成图像,在面向背景复杂的自然场景文本图像时,仍然是一项具有挑战性的任务。针对自然场景中密集文本检测受限、漏检的特点,设计了一种基于改进的Dense Net网络的文本检测方法,首先,采用可变形ROI池代替平均池化层改进Dense Net网络作为特征提取网络,实现对不同尺度的文本进行自适应局部定位,然后通过卷积注意模块对多层级图像特征加权,增强文本特征。此外,在特征融合时引入可变卷积代替普通卷积,增加调整卷积核的方向向量,从而使采样网格自由变形,促使卷积核的形态更贴近文本形状。最后,在输出层引入辅助的双向长短期记忆网络,聚集文本区域。该模型相较于已有的方法在ICDAR2013数据集上提高了近1.11%,在ICDAR2015数据集上提高了近1.17%,一定程度上提高了检测的精确率。针对自然场景中密集文本形态多变和弯曲导致识别困难的特点。设计了面向场景图像文本的矫正和识别方法。首先,利用矫正网络矫正场景文本,然后获取校正后的文本,将该文本输入到双分支网络模块,根据提取的图像特征进行融合。双分支模块分别利用Inception V2和可变卷积代替普通卷积,使得卷积核的方向向量可以任意变化,促使在训练过程中卷积核的形态更符合提取特征图中的文本。最后,通过嵌入注意力的双向门控循环单元获取不同权重的文本语义信息。实验结果表明,该模型在ICDAR2013、ICDAR2015和CUTE80数据集上取得了令人信服的结果,尤其在弯曲变形文本CUTE数据集上表现最好,准确率高达89.54%,相比于传统的方法提高近1.9%,该模型可以有效识别扭曲变形的文本信息。总之,本文针对现有的文本检测与识别方法的不足提出了相应的解决方案,在一定程度上解决了场景文字检测与识别的问题。
其他文献
报纸
在石油化工、塑料、制药和食品加工等行业的生产过程中会产生大量的难降解有机污染物,这些有机污染物具有难降解、稳定性强等特点,被排入到水环境中会对生态环境造成破坏。高级氧化技术是去除水中有机污染物最有效的方法之一,基于硫酸根自由基(SO4·-)的高级氧化技术因其成本低、操作简单和效率高等优点而受到国内外研究者的广泛关注。在众多活化过氧单硫酸盐(PMS)的方法中,过渡金属活化法是应用最为广泛的一种方法。
学位
报纸
学位
基于视觉的机器人抓取工作是目前计算机视觉研究在实际生活中的重要应用之一,已经广泛应用于垃圾分拣、工业零件加工、快递物流传输等方面。相比传统算法成本高且耗时长的问题,基于深度学习的机器人视觉抓取方法在确保高检测速度的同时,也减少了成本,且具有较高的准确度,体现出很高的实用价值。本文对基于深度学习的机器人视觉抓取方法中的物体位姿估计技术,与目标识别技术展开了相应研究,针对传统机器人抓取算法成本高、位姿
学位
目的研究黄芪多糖(Astragalus polysaccharides,APS)对卷曲乳杆菌体外生长的影响效果。方法测定卷曲乳杆菌在不同APS剂量的MRS液体培养基中随时间变化的吸光度(A值)。结果卷曲乳杆菌的A值随着APS剂量的增加而增大,且呈一定的时间-剂量依赖性,当黄芪多糖剂量为10μg/mL、作用14 h时细菌浓度达到峰值。结论黄芪多糖对卷曲乳杆菌体外生长具有促进作用,促生作用强弱与黄芪多
期刊
面部表情在人们的日常生活中有着举足轻重的作用,微表情是一种可以揭露人们内心真实情绪的面部表情,它具有持续时间短、动作幅度小,不受人的自主意识控制等特点,通常不易为人眼所察觉。一般而言,微表情都和说谎情境相关,因此在临床医学、刑侦审讯和国家安全等领域有着重要的实用意义。然而由于微表情自身的固有特点,使得检测和识别微表情尤为困难。因此,构建出一个自动化的检测和识别微表情的算法具有十分重要的实际应用价值
学位
航空航天等高端装备领域对高性能的追求,导致其对精密和复杂整体高强铝合金构件的需求迫切。选区激光熔化(SLM)技术可解决兼顾复杂形状和高性能金属构件快速制造的技术难题。Al-Si-Mg合金是目前获得商业应用的主要SLM成形铝合金体系,但其强度和塑性较低,不利于应用。基于此,本研究在课题组前期工作的基础上,以SLM专用高Mg含量AlSiMg1.4合金为基础,通过引入Zr作为晶粒细化剂,提升合金的力学性
学位
液压系统是工程设备的核心组成部分之一,一般来说,液压系统的工作环境较为复杂,在运行过程中其元件会出现退化现象,甚至产生故障。作为液压系统中的关键元件之一,液压泵的性能优劣将对整个液压系统的正常运行产生影响。因此,进行液压泵故障诊断和健康状态预测方法的研究对整个液压系统的稳定运行具有重要意义。近年来,有关深度学习的研究不断取得新的进展,深度学习方法也广泛应用于各种领域。因此,本文在深度学习的理论基础
学位
近年来,微通道沸腾换热已在电子产品得到初步发展。本文对三种烧结通道结构内的沸腾换热性能进行了详细研究,分别为铜粉烧结而成的烧结微通道、铜粉烧结扁平通道和铜粉与造孔剂混合烧结微通道。研究中采用可视化与压力同步采集方法,对微通道内的相变换热模式和CHF(临界热流密度)机理进行了探究。在先前工作的基础上,论文改进了热沉室设计,并对铜粉烧结微通道工艺也进行了新的摸索;然后并对样品结构参数进行详细表征,包括
学位