扭曲文本矫正方法研究及在电力标牌识别中的应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:Pinger605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以自然场景下扭曲文本为研究对象,从光照均衡、文本检测和扭曲矫正三方面进行研究,并将算法应用于电力场景中的标牌图像,搭建了扭曲铭牌识别系统,本文主要工作及贡献如下:(1)针对光照多变引起的高光图像和低照图像,提出一种光照均衡算法应用框架。首先用支持向量机作为亮度分类器判断输入图像的亮度,然后根据亮度类型采用对应的处理算法,使用改进后的高效像素聚类算法去除高光,使用低光照增强算法提升低照图像亮度。光照均衡化后,与之前的图像保持0.929的结构相似度,去除负面光照影响的同时保留了原本的结构。(2)改进了DB文本检测算法,并且建立了一个电力场景文本数据集。DB模块与分割网络共同优化可在复杂背景上得到准确的文本区域,但容易产生文本行断裂的情况,基于DBSCAN聚类改进DB算法。使用改进后的DB算法在电力场景文本数据集上检测,F值在原DB模型的基础上提升了3.4%(Res Net-18)和2.8%(Res Net-50),同时检测速度较快,分别为45FPS(Res Net-18)和22FPS(Res Net-50),满足扭曲铭牌识别系统检测时的准确性和实时性要求。(3)针对扭曲文本识别准确率较低问题,提出了一种将Cycle-GAN与梯度先验损失相结合的扭曲文本矫正算法。首先采用可学习代理网络,在检测后切割出来的平展文本图像上进行扭曲增广,既获得了训练所需的成对“平展-扭曲”数据,又得到一个扭曲文本数据集,解决了扭曲文本数量不足的问题。矫正网络以Cycle-GAN为基础架构,通过两个生成器迭代对抗,将扭曲文本矫正为平展文本,同时又引入梯度先验损失,提高了生成的平展文本的清晰度。加入矫正网络后,识别准确率比矫正前提升了5.38%。(4)设计扭曲铭牌识别系统,整合上述算法研究成果,应用于电力场景中的扭曲铭牌识别任务,使用Intel发布的深度学习部署工具套件Open VINO,将本文的检测、矫正和识别模型部署在带Intel CPU的PC机上,取得了与GPU平台相近的精度和速度。
其他文献
近年来,人脸识别技术在安全检查、服务机器人和快捷支付等领域的应用愈发广泛。与深度神经网络技术相结合形成的用于服务机器人的人脸识别系统,可用于提高服务机器人与被服务对象的交互,是智能机器人控制领域的研究热点之一。本文基于Ty Ran移动机器人硬件平台,研究了针对局部遮挡人脸的修复算法,并设计了基于人脸检测、人脸修复和人脸识别算法的机器人人脸识别模块,主要完成的工作如下:1)针对正常情况下的人脸识别问
学位
在现代社会中,机械臂被广泛应用于制造业,以代替人力劳动,但是随着生产要求的提高以及生产任务的复杂化,单机械臂很难完成一些复杂任务,例如精细零件装配、重型物体的搬运以及工艺复杂的切削操作,要完成这些比较复杂的任务,需要双机械臂协同工作。本文主要在单机械臂运动规划的基础上,对双机械臂协同运动规划算法进行研究。首先,基于单机械臂运动学分析,建立双臂系统模型。采用D-H方法建立单机械臂的运动学模型,并进行
学位
随着城市轨道交通的快速发展,列车运行安全受到更为普遍的关注。轮对是列车走行部的关键装置,当车辆运行条件变差或者紧急制动时,列车在轨道上产生剧烈地滑动摩擦、冲撞,导致踏面出现擦伤、剥离、划痕等损伤。针对轮对踏面损伤的检测,本文实现一种基于图像的非接触式检测方法,利用深度学习目标检测原理研究踏面损伤识别与定位。主要内容如下:首先,针对轮对踏面损伤的样本数量不足问题,提出了基于数据增强和深度卷积对抗生成
学位
中点箝位型(NPC)三电平并网逆变器在中高功率的并网发电场合中获得了广泛的应用,而电感-电容-电感(LCL)滤波器由于其良好的滤波性能被串接在逆变器和电网之间,但是由于实际中弱电网阻抗的存在,并网逆变器系统的稳定性和动态性能均会受到影响。本文研究解决提高弱电网下的LCL型NPC三电平并网逆变器稳定性及动态性能问题,提出了一种电流控制器和有源阻尼控制器参数设计方法。本文建立了弱电网下LCL型NPC三
学位
随着我国城镇化水平的快速提升,各大城市GDP逐年增加、由农村涌入城市的人口数量逐渐扩大,城市轨道交通作为缓解交通压力的重要交通工具,近年来的需求不断递增,中国地铁建设迎来了蓬勃发展的春天。地铁的施工有其独特的特点,建设投资之大,建设工期之长,施工环境之复杂等等,这些因素是造成城市地铁施工阶段安全生产事故的主要原因,严重影响了工程的建设进度,并给社会带来不利影响。因此,针对于城市地铁项目施工安全管理
学位
近年来,主要军事强国都在加速研制新型空中武器装备,这对防空武器伺服系统的响应速度、控制精度和输出功率等提出了更高的要求。本文针对新型武器伺服系统大功率、高精度、强鲁棒性等需求,设计了一种多电机同步驱动伺服系统。具体内容如下:首先,在对多电机同步驱动伺服系统功能需求进行深入分析的基础上,结合性能指标要求,完成了四电机同步驱动伺服系统总体方案设计,并对关键部件进行了选型。其次,在对单电机控制系统动力学
学位
路径规划是机器人研究中较为基础和关键的方向,近年来深度强化学习在机器人控制方面取得了巨大的成功,该方法不需要控制对象模型,具有很强的环境适应性和自学习能力,得到了广泛的关注。随着任务的复杂化和多样化,单机器人已经不能满足这类场景的需求,多机器人系统通过各单位协同能够处理更复杂的任务,而多机器人编队作为其重要的研究方向也成为一个研究热点。为了在复杂场景下更好地完成任务,本文将全局路径规划算法和局部路
学位
质子交换膜燃料电池(Proton Exchange Membrane Fuel Cell,PEMFC)是一个多变量、强耦合、非线性的复杂系统,建立准确的电特性模型是对其进行电特性控制研究的基础,设计合适的控制策略是提高其发电性能的关键。本文将分数阶微积分理论与频域子空间辨识方法相结合,建立准确描述PEMFC电特性的分数阶状态空间(Fractional Order State Space,FOSS)
学位
武侠文化是中华民族特有的一种文化,经过了几千年的传承与演变,已经有其独特的价值和韵味。伴随着社会经济的多方面发展,武侠游戏作为武侠文化的新时代产物迅速被武侠爱好者们所关注与喜爱,游戏中的各类角色的鲜明形象更是给玩家留下深刻印象。线上游戏行业的大力发展,催生了线下游戏文创产业的互动。在商品经济日趋壮大的今天,武侠游戏类文创产品的发展将有利于武侠文化得到更广泛的传播。本课题首先对武侠文化、游戏角色和文
学位
闽南古厝红砖装饰纹样作为建筑装饰语言,是闽南地域性建筑装饰的主要表达形式。它反映了该地域的历史变迁和时代发展,承载地域性的人文情感和审美意趣。闽南古厝的红砖装饰纹样具有精湛的拼花工艺与意蕴深厚的红砖装饰纹样,是地域文化的重要物质载体,具有历史解读和人文研究的价值。因此,闽南古厝红砖装饰纹样作为探索闽南文化的重要组成部分之一,将符号学的方法应用于红砖装饰纹样的研究之中,从一个新的角度对闽南古厝红砖装
学位