基于深度学习的自然场景文字检测与识别方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:pbsiszx1234567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字与我们的生活息息相关,大量的信息通过文字来传递。文字中包含的丰富、准确的高级语义信息可以帮助人们理解周围的世界。因此,文字的检测和识别一直是计算机视觉领域的重要任务。传统的OCR(Optical Character Recognition)技术,只针对文档图片识别设计,在面对场景文字检测和识别时遭遇挑战。近几年随着深度学习的快速发展,越来越多的研究领域引入深度学习,并取得了极大的成功。本文针对场景文字检测和识别出现的问题进行分析,引入深度学习,构建深度模型,开展场景文字的检测与识别研究,具体工作如下:本文设计了一种基于位置敏感分割的多向场景文字检测网络模型。该网络基于分治的思路,将完整的文本检测划分为3个子文本的检测,对每个子文本的检测采用基于无锚的目标检测算法,通过基于位置敏感的非极大值抑制算法将子文本组合起来得到最终的检测结果。同时,设计了一个自适应权重特征融合模块,让网络自主学习不同特征层的融合权重。最后,在ICDAR2015和MSRA-TD500两个公开数据集上进行实验验证本文提出算法的有效性。针对不规则文本识别,本文设计了一种基于反馈机制的可端到端训练的场景文字识别模型。首先采用基于空间变换网络的矫正机制对不规则文字进行矫正,其次在编码阶段引入反馈机制来引导低层视觉特征到上下文特征的编码,同时引入CTC(Connectionist Temporal Classification)解码分支作为中间监督,以提高模型对相关视觉特征属性的提取性能,最后采用基于注意力机制的解码器得到识别结果。该模型在7个数据集上进行测试验证,表现出较好的识别性能。
其他文献
人工神经网络是由大量神经元通过特定方式连接形成的一种复杂网络结构,是模拟人脑神经网络结构与信号传递机制提出的一种人工智能系统。人工神经网络具有自适应、自学习、自组织能力,广泛应用于函数逼近、图像处理、模式识别与医学诊断等领域。人工神经网络的实现分为软件实现与硬件实现。软件实现的人工神经网络在网络搭建、权值优化与数据可视化等方面具有很大优势,但数据并行处理能力差,速度慢;硬件实现的人工神经网络在数据
学位
永磁同步电机具有高功率密度、结构简单、过载性能好、转矩脉动小等特点,在现代驱动应用(如电动汽车、伺服驱动、工业过程等)中与其他电机相比占有较大比重。电机在实际运行时,磁链和d-q轴电感等参数因磁饱和而发生变化,这些变化引起的不确定性对系统的控制性能有较大影响;此外,外部环境中不同温度或工作条件也会降低驱动系统的稳定性。滑模控制因其强鲁棒性在永磁同步电机系统中使用较为普遍。本文采用新型趋近律设计永磁
学位
永磁同步电机(Permanent magnet synchronous motor,PMSM)具有结构简单、效率高、功率因数高等特点,使其在工业领域有着广泛的应用。PMSM传统的矢量控制系统速度环与电流环通常采用PI控制器,原理简单易于操作,但由于鲁棒性不强,容易受到参数变化及负载扰动的影响而降低调速品质,难以达到高性能调速要求。因此,研究PMSM调速系统先进控制策略势在必行。本文在矢量控制系统基
学位
轮缘推进器将螺旋桨、推进电机集成于一体,具有结构紧凑、效率高、绿色环保等突出优点,是船舶电力推进技术的革命性创新。在轮缘推进器中采用永磁容错电机既可提高推进器的效率、减小体积又可提升轮缘推进器的可靠性。传统电流滞环控制具有算法简单、动态性能好、实用性强等优点,但在低频时存在电流控制精度低、转矩脉动大的问题。因此研究永磁容错轮缘推进电机改进电流滞环控制技术具有重要的实际意义。本文首先介绍了六相永磁容
学位
近年来,国际化教育蓬勃发展成为中国社会的热点,国际学校在中国的发展也应声而起。快速扩张的国际化教育市场,对外籍员工的需求也日益旺盛,而能否留住具有竞争力的人才成了学校得以长远发展的关键。然而,外国来华工作者面临的跨文化适应问题成了阻碍其在华工作稳定性的重要因素,实施积极有效的组织社会化策略是促使外籍员工较快适应和融入组织的重要且关键的途径。本论文选取A国际学校为研究对象,以组织社会化策略为基础,通
学位
股份有限公司在我国商业社会的发展进程中扮演了极为关键的角色,其对于我国资本市场的迅速扩张以及现代公司治理实践的发展有着举足轻重的作用,能够研究清楚股份公司治理模式的本质也就意味着可以融会贯通公司法相关规定背后的法理精神。众所周知,董事会作为经营管理机构对公司有实际控制权,把握住董事会也就掌控了公司的远航之舵,因此,董事提名权成为股东必争之权。现阶段我国上市的股份公司中存在很多国有股、法人股,这是由
学位
医疗卫生行业是国家的基础行业,事关国计民生,而医院作为医疗卫生行业的基本载体,为普罗大众提供便利、快捷、高效的健康服务是医院的核心责任。随着我国不断深化医改,合理配置资源、寻求可持续发展、降低药品安全管理成本、提高业务效率、改善服务环境正逐渐成为我国医院管理的重心。在我国住院病人治疗体系中,药物治疗,尤其是输液药品治疗的比重非常大,因此,静脉输液药物安全、及时的供应,关系到医院的合理用药水平,各个
学位
为充分利用永磁超环面电机的电磁转矩,研究了超环面电机最大转矩电流比MTPA(maximum torque per ampere)矢量控制系统。首先,分析了超环面电机蜗杆内定子变截面的结构特点和行星轮磁齿的运动规律,推导了永磁超环面电机驱动系统的时变数学模型;然后基于极值原理和公式法,得到永磁超环面电机输出转矩与交直轴电流的函数关系;结合闭环反馈得到行星轮转子的位置信息,搭建了该电机的MTPA控制系
期刊
对2018—2019年吉林大学第一医院的111名老年人的体检数据进行老年健康指标构建、异常指标差异性分析以及基本信息文本分析,以达到对老年群体健康水平的综合评价的目的。利用Wilcoxon非参数检验分析出不同年龄间身体质量指数BMI、血红蛋白和TG3项指标差异性较大,不同性别间TC和HDL-C两项指标差异性较大。结合体检数据中的不同信息对老年群体进行多层次健康分析,对全面评估老年人的身体健康具有一
期刊
在存量规划的背景下开展城市更新,迫切需要在国土空间规划城市体检评估工作中有效评估城市更新的实施效果,为后续优化城市更新工作提供依据。文章结合政策文件要求、城市体检实践经验和国内外相关指标体系,构建了城市更新视角下的城市体检评估指标体系,为城市体检评估和城市更新评估工作的开展提供借鉴。
期刊