深度图像识别模型与高效算法研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:iloveyouguoran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代化建设的加快,变电站有了对设备运行状况进行快速检测的需求,而以前的人工巡视、人工参与仪表的记录与读数已不能满足这迫切的要求;此外,由人工参与方式所带来的缺点还有由于工作人员的工作强度大所导致的不精确读数,人力成本高等;这些都说明了人工参与这种方式已不能完全满足现代化工业生产和发展的需求。从仪表成像的角度上看,在自然环境下所得到的仪表图像可能存在以下问题:图像清晰度低,仪表位置靠近图像边界,受光程度不同,具有复杂背景等。考虑到上述问题,以及近年来深度学习在图像领域取得的巨大成功,本篇论文依据深度学习及数学知识,首先对目标检测、语义分割、数字识别等领域进行了研究,并结合主成分分析(Principal components analysis,PCA)、最小二乘法、K-Means等算法提出了一种用于检测指针式仪表与识别示数的算法。经过实验论证,本篇论文提出的算法可以使得仪表图像清晰度以及示数读取准确率都有较高水准。本文的主要研究内容为:(1)提出了一种基于YOLOv3的指针式仪表检测算法。由于残差密集网络能够简化深层网络的训练过程并让网络层基于输入信息去学习残差函数,可通过将残差密集网络引入YOLOv3中方式来改善网络性能。在此基础上,对损失函数进行了研究,提高了检测精度并有效改善了二分类数据集不平衡的问题。实验结果说明,改进后模型不仅具有更高的准确度还可快速对目标图像进行检测。通过此特性,可实时检测仪表在图像中位置,并通过调整拍照角度和距离,以确保得到的仪表图像拥有较高的清晰度。(2)利用语义分割概念,在U-Net模型的基础上,对模型进行改善,提出了一种指针式仪表元素分割算法。并通过实验,对仪表区域中的元素如指针、刻度数值以及刻度值标记进行了分割,由实验结果验证了该分割算法的有效性。(3)将仪表元素分割得到的刻度数据作为数值识别的数据集。在VGGNet模型的基础上,针对原模型拥有较大参数量的缺点,进行了改进。最后,进行了实验,实验结果表明了改进后的模型对刻度数值拥有较好的识别效果。(4)通过上述步骤,得到了关于刻度线,刻度值标记以及指针在仪表中的分割图。利用直线拟合算法进行直线的拟合,通过分割出的指针区域得到代表指针的直线。两指针直线交点就是仪表中心。通过上述条件可计算出读数所需角度,最终进行读数的计算。最后,通过实验验证,即使是在较少数据的情况下,本文提出的算法也表现出了较高的读数准确率。这也说明了该算法的可行性与可靠性。
其他文献
肠系膜缺血,特别是急性肠系膜缺血,是一种急性致死疾病,死亡率高达70%。其中,肠系膜静脉血栓被认为是肠系膜缺血的原因之一,占肠系膜缺血病例的5%-15%。因此,能否获得肠系膜血管网络的准确结构及功能性参数对研究肠系膜静脉血栓的形成机制,监测血栓形成后的血管变化十分重要。光声成像是一种结合了光学吸收和超声探测的新型光学成像方法,通过使用脉冲激光照射样品,使样品吸收光能量,并探测由于热膨胀效应产生的超
生物数学是由数学与生物学结合而成的,并在广泛的应用中建立和完善其理论体系,发展了许多适应于生物学特点的独特数学方法。目前,生物数学是一门比较完整且相对独立的学科,它包含许多重要的分支。其中,种群动力学是迄今为止数学在生态学中应用得最为广泛和深入,发展得最为系统和成熟的分支。由于捕食模型通常具有丰富的种群动力学行为,所以捕食模型一直是众多数学家和生物学家研究的一个重要课题,空间非齐次与功能反应函数通
在传感器获取或传输复杂的图像数据时,由于传感器损坏或环境条件的恶劣,会导致图像部分信息缺失,而恢复丢失的数据信息则被认为是后续图像处理的基础。近年来,利用张量及其分解来处理复杂的图像数据变得越来越普遍。在本文中,我们将以张量分解为基础,进行关于张量完备问题的理论和应用研究:充分地探索图像数据的潜在先验知识与张量完备的图像处理技术的应用。目前,基于张量奇异值分解(tensor singular va
随着5G、云计算、传感设备等技术的快速发展和应用,车联网作为实现智能交通管理系统的基础逐渐成为了各领域学者的研究热点。在车联网中,车辆可以利用车载单元与另一辆汽车或者路边基础设施进行通信,及时交换交通安全信息,从而提高用户的行车安全和驾驶体验。然而,由于车联网是开放的无线通信系统,这使得恶意攻击者可以轻易地对传输的消息发起各种网络攻击,此外,若是车辆直接使用真实的身份进行通信,必然会造成车辆的身份
氢气由于具有储量丰富、成本低、可再生、能量密度高、零排放等特点,被认为是一种极具潜力的化石燃料替代品。在氢能的应用中,如何安全高效地存储氢气一直是一项艰巨的任务。近些年来,人们致力于探索存储氢气的不同方法和技术。高熵合金(HEAs)是一类包含五种或五种以上近等摩尔比元素的材料,它已经展现出优秀的储氢特性,如单相可逆特性和快速吸氢动力学。但是,高熵合金的储氢能力仍需提高,其吸氢/脱氢的基本机理也需得
磁流体动力学是由瑞典物理学家汉尼斯·阿尔文提出的,它是描述不可磁化的导电流体在电磁场作用下运动的一门学科,广泛应用于天体物理学、受控热核反应、航天工程等多种研究领域。磁流体动力学的基本方程是由流体力学中的纳维-斯托克斯方程和电磁学中的麦克斯韦方程通过洛伦兹力耦合而成的。磁流体动力学方程是非线性偏微分方程组,一般情况下其解析解难以得到,只能数值求解。基于以上背景,在本文中,我们将系统研究磁流体动力学
自从光通信技术中的烽火传信诞生以来,空间光通信便推动着全体人类将所在的社会由之前的工业化社会转向现在的高速信息化社会发展。自由空间光通讯的诞生,带来了具有更安全私密,功耗更低,抗电磁干扰能力更强,传输容量更大,设备体积更小,架设更方便的技术。用于发射和接收载有信息光束的光学天线和用于光束传输的光纤是光学传输系统中十分重要的器件。为了提高传输效率,光学天线的中心遮挡是研究人员一直在不断探索的问题,本
能源是人类社会发展的动力,是实现可持续化发展的关键因素之一,因此各国都在积极研究可控核聚变发电,而激光惯性约束聚变则被视为最可能实现可控核聚变的技术方案。本文针对惯性约束聚变对宽带且高效的三倍频过程的需求,利用理论分析与数值模拟的方式,展开超辐射光的三倍频过程以及通过其他方式补偿超辐射光三倍频过程中的失配量的研究,取得了具有对超辐射光后续实验有指导性意义的结论。主要的研究内容分为以下四个部分。1、
非线性波动方程是一类常用于描述自然现象的数学模型,也是非线性数学物理领域的前沿课题之一,相比单一的理论研究现在更侧重于结合实际应用。通过研究非线性波动方程的解,有助于推动物理学、工程技术等相关学科的发展。本文研究如下两类Rosenau方程Cauchy问题的解:一类经典Rosenau方程和一类具有Stokes阻尼项的六阶非线性波动方程。本文主要内容如下:第一章介绍非线性波动方程的物理背景、研究意义及
随着移动化设备的普及和社交媒体的涌现,汇聚了海量的用户数据,形成了多样的社交网络。如何从多元化信息中提取关键特征,简洁、快速地表达用户影响力,有利于态势感知与舆论导向,有助于区域的综合管理。尽管这方面的研究已经趋于饱和,但现有的建模方法仍然存在以下问题:一是数据缺省与不可信问题,包括数据缺失、信息虚假与隐私保护等;二是信息提取不全面问题,包括研究角度单一、特征复杂冗余以及数据之间存在着相似性与异构