基于深度学习的任意形状文字提取技术

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:zero_alan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
任意形状文字提取技术用于检测图像中任意排列的不规则英文文字并将其准确识别,该技术可以提升视觉机器提取场景或图片中关键信息的能力。文字的检测与识别目前是图像识别领域的一个热门研究项目,它与我们的生活密切相关,尤其在场景理解、自动驾驶、残障辅助等方面都有着不错的应用前景。深度学习也在计算机高度发展的当代有着不俗的研究价值,而且已经从学术研究领域逐步迁移到人们的生活应用之中,深度学习可以根据不同的任务自动学习数据中的特征,经过深度学习的特征通常具有较好的鲁棒性。深度学习在文字提取领域逐渐成熟,特别是对于形状比较规则的文字,已经有诸多不错的识别效果。任意形状文字是指同一图像中方向和形状不统一的文字集合,现有的算法很难高效准确地识别出带有任意形状特征的文本,再加上文字图像中复杂的背景信息,识别起来有较大的困难。本文在深度学习基础上提出一种新的文字提取技术,该系统包含检测、矫正和识别算法。具体工作如下。首先,针对任意形状文字的检测,设计一种任意形状文本检测网络,采用预处理模块来过滤背景冗余信息,通过对图卷积层、图池化层、输出层和全连接层的改进来构造全新的检测网络,从而改善图卷积网络的特征提取能力,采用多层感知机网络进行特征学习,通过Softmax分类器进行文字区域划分,并使用回归函数对检测区域进行参数调整,解决文本检测在边缘区域的偏差问题。然后,针对任意形状文字的矫正,设计形状表达模块来生成贴合任意形状文本部分的轮廓框并进行轮廓标签,对标签后的轮廓框基于薄板样条插值方法实施矫正,从而将任意形状文字矫正成较规整文字,以便后续的文字识别。最后,针对任意形状文字的识别,设计图卷积网络与图注意力机制结合的识别网络,该方法能够解决旋转后含义不同的字符在识别时方向的正确性,通过引入门控循环单元解决文本信息丢失与训练速度过慢等问题。本文提出的文字检测与识别方法在多种具有任意形状英文文本特征的数据集上均达到较高的指标。
其他文献
波达方向估计(Direction Of Arrival,DOA)是阵列信号处理领域的一个重要分支,被广泛应用在雷达、声呐、射电天文学、导航和无线通信等相关领域。阵型设计对DOA估计性能具有重要影响,相比于均匀阵列,在相同的物理阵元情况下,稀疏阵列可获得更高的角度分辨力和更多的估计自由度。因此,如何利用有限的物理阵元提升目标分辨性能,已成为当前阵列信号处理研究的热点问题。本文以互质阵列为研究对象,提
学位
乡土小说是指以农村生活为题材的小说,由鲁迅开创,后经发展形成不同派别,但大多数乡土小说作者总是以局外人的眼光来看待农村。赵树理的出现,打破了这一固有模式,他从农民的视角出发,展现中国农村发展过程中存在的种种问题。本文尝试从中国乡土小说的发展与时代精神的关系出发,探讨赵树理乡土小说模式形成的原因及其后续发展。
期刊
随着人类对周围环境的探索开发,控制领域的被控对象越来越复杂,性能指标越来越多样化,控制器设计问题越来越具有挑战性。基于学习的控制理论通过结合智能学习算法和经典控制方法,对未知变化规律进行学习,能够应对更加艰巨的控制任务。本文主要研究基于极值搜索学习的自适应控制方法,总结控制器设计特点,为更多学习型控制器的研究和应用积累经验。针对一类具有慢时变扰动的广义线性系统,本文提出一种线性二次型学习控制器设计
学位
随着工业与科技的发展,现代化工业开始进入智能化时代。人们对于核电工业技术的革新提出了高效、智能等方面的需求,并对核能工业控制品质的要求越发严格。然而现阶段核电系统通常具有多变量强耦合性和复杂强非线性的特点,存在难以建立准确的机理模型的问题,传统自适应控制理论难以获得令人满意的控制品质。自适应动态规划(Adaptive dynamic programing,ADP)算法作为一种自学习最优化算法,结合
学位
目前,大量学者投身于网络控制系统(Networked Control Systems,NCSs)的研究。本文主要针对时频性能作用下的事件触发网络系统渐近跟踪控制器进行设计。经过查找,在频域方向对于系统性能改进的研究和在时域方向对于提高系统性能的研究都有很多,但是同时考虑两种性能提升的很少。本文所考虑得时频性能即考虑时域α稳定的方法和频域的H∞性能同时作用于跟踪控制器两种性能,主要在以下几个方面开展
学位
足式机器人可以代替人类进入到危险的环境中工作,在足式机器人中,六足机器人具有更高的稳定性及承载能力,使其在灾难救援等领域得到了广泛应用。但是六足机器人在复杂工况中工作时存在诸多未知因素,单纯的依靠机器人自身智能控制算法势必无法较好地完成工作任务。本文以六足机器人操控系统作为研究对象,为了使机器人能够更好地完成特殊任务,采用遥操作技术将人的决策能力引入到操控系统中,但远距离的操控引起了不可避免的通信
学位
<正>美军单兵便携式地面无人装备(以下简称相关装备)列装后,人与相关装备组成了人机协同作战单元,受人工智能等技术水平限制,相关装备将长期处于人在OODA环路中为主、人在环路上为辅的自主水平,以遥控为主要控制方式,涉及战前机动等个别非对抗行为可由人监督其半自主执行。人机协同时遥控为主的控制方式表现出人员干预引导多的特征,遥控手的作战使用决定了人机协同作战能力。美军相关装备参战已20余年,积累了丰富的
期刊
网络控制系统(Networked Control Systems,NCSs)在生产生活中具有较高的应用程度。其广泛应用的同时也存在着不容忽视的缺点,如何避免通讯信道的拥塞及网络资源的浪费都是学者们研究的重点领域,网络系统稳定依然是正常运行的必要条件。为实现这一目标,本文主要研究线性和非线性网络系统的事件触发动态输出反馈H∞控制。系统响应速度的提高可以通过对系统进行极点约束实现,在NCSs中有关极点
学位
在图像拍摄过程中,由于拍摄器材与被摄物体间发生相对运动,导致拍摄图像质量退化,出现运动模糊。这些模糊图像通常无法满足人们日常的需求,也难以作为各种人工智能算法处理的基础数据,因此对运动模糊图像进行恢复,提高图像质量成为当下图像研究的重点之一。图像恢复领域中,数据获取通常是一个困难的问题,清晰与模糊的图像对不能通过常规拍摄的方式获取。因此,大多数图像恢复研究都是基于合成图像对训练。为此利用生成对抗网
学位
为完善我军智能无人装备体系建设,借鉴美军经验做法,分析美军空中、地面、海上智能无人装备系统建设现状,总结其智能无人装备系统建设特点,从做好整体规划、深化军民融合、加强实战演练、加快人才队伍建设4个方面,提出加强我军智能无人装备体系建设的建议。
期刊