复杂自然场景下视觉显著目标的精确检测关键技术研究及应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:kfanffvga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着便携式摄像机与红外热像仪等产品的普及,以及无人机与巡检机器人等技术的快速发展,图像已成为智能电网中承载和传递信息的重要渠道。现代社会在享受图像所带来便利的同时,如何利用计算机智能地感知与理解这些海量的视觉数据却面临着诸多挑战。人类视觉注意力机制能够帮助人类迅速、准确地捕捉图像中突出的或感兴趣的区域,并潜意识地过滤不感兴趣的内容,而视觉显著目标检测旨在模拟人类的这种视觉感知能力,以便后续视觉任务聚焦于图像重要区域的加工,避免对无关视觉信息的处理以提高计算效率和节省计算资源。为了使视觉显著目标检测技术更好地服务于其它视觉任务以及实现更广泛的应用场景,开发出能够适用于复杂自然场景的精确检测模型是当前计算机视觉领域亟待研究的重要课题之一。本文围绕视觉显著目标检测开展研究工作,探索传播模型和深度学习两方面关键技术,致力于精确鲁棒的检测方法。此外,考虑到近年来我国大力推动智能电网的建设工作,利用前沿的计算机视觉技术实现智能化运检已逐渐成为现代化电网建设的重要一环,因此本文还将进一步探索所设计的深度显著性模型在电力系统场景中的应用价值。具体研究内容如下:1.针对已有基于背景先验的标签传播方法的不足,提出了一种基于网页排名和局部样条回归的显著性检测方法。通过构建基于多种图像特征融合的二尺度图模型,以探索不同图模型尺度下的显著性以及显著性融合策略。在图模型的基础上,利用网页排名算法对边界背景先验信息进行显著性信息的传播,从而生成初步的显著性图。根据两个图模型下的显著性结果筛选出更鲁棒的背景节点和前景节点,再利用局部样条回归进一步增强显著性区域。实验结果表明该方法比大多数主流的传统无监督方法更具优势。2.为了克服传统方法中手工特征的缺陷,提出了一种基于多尺度深度编码器-解码器网络的显著目标检测方法。考虑到基于手工特征的传统方法无法较好地表征图像语义信息,该方法采用了具有提取高级语义特征能力的深度卷积神经网络进行检测模型的设计。由于早期的深度显著性模型不能准确地分割显著目标的边界区域,该方法提出了一种端到端的深度编码器-解码器网络,以由粗到细的方式生成细粒度的显著性图。为了引导深度模型对关键特征的学习,设计了一种语义信息指导模块以防编码器深度特征的稀释。另外,该方法对输入图像进行多尺度变换,提高了深度模型的多尺度特征提取能力。实验结果表明所设计方法的性能优于11种主流的显著目标检测方法。3.为了进一步提高深度卷积神经网络的特征提取能力,提出了一种融合局部和全局上下文的显著目标检测方法。该方法设计了一种上下文感知的空间注意力模块,这有助于各个像素点自适应地收集它的上下文信息。通过将该模块嵌入至深度卷积神经网络,计算每个像素点的专属权重图以衡量上下文范围内各空间位置的重要性,从而有效地加强了同类别像素点之间的信息传递并免于测地距离的束缚。此外,该深度显著性模型还从局部注意力和全局注意力两方面充分地融合多尺度语境信息,以优势互补的方式进一步提升其检测性能。实验结果验证了所提方法的优越性,其性能达到了先进水平。4.将本文所设计的基于深度学习的显著目标检测方法应用于多种电力系统场景。这些电力视觉任务包括输电线路绝缘子分割、变电站可通行区域检测、以及电力场景下烟雾检测。首先收集特定电力场景下的图像以构成一定规模的图像数据集,再进行像素级的人工标注,最后对深度显著性模型进行训练优化以及性能评估。实验结果表明视觉显著目标检测能够很好地迁移至电力视觉任务,在未来具有潜在的应用前景。
其他文献
生物分子相互作用贯穿整个生命活动,其过程的动态监测在生命科学研究、医学诊断、新药研发、农业与食品生产等领域具有广阔的应用前景。非标记生物传感因其能够进行实时、原位分析非常适合对生物分子相互作用过程进行动态监测。反射干涉光谱法(Reflectometric Interference Spectroscopy,RIfS)是一种利用白光干涉原理实现对薄膜光学厚度(薄膜的物理厚度与整体折射率的乘积)的测量
反对腐败、建设廉洁政治,是我党一贯坚持的鲜明政治立场,是人民群众关注的重大政治问题。当前,世情、国情、党情日益发生着深刻的变化,我们必须认识到腐败现象严重损害党的纯洁性,严重影响党的执政地位的巩固和执政使命的实现。因此,加强廉洁从政教育,筑牢党员干部拒腐防变的思想道德防线,促使党员干部廉洁自律、秉公用权,意义重大。在认真学习《党员干部的15堂
会议
“十二五”以来,随着我国城市化的发展,城市中的土地资源愈加紧张,大城市中的建筑越来越偏向于中高层结构。在现有的各种中高层结构体系中,框架结构占据着主导地位。但在实际使用中,框架结构由于其结构体系的限制,存在刚度较弱、抗震性能较差、跨度较小等缺点,限制了其在高层结构中进一步的发展。基于我国发展的实际需求以及传统结构的种种缺点,本文提出一种新型高层大跨度空间网格盒式结构,通过使用空腹夹层板和网格式框架
随着我国东部沿海地区经济建设的发展,土地资源紧张已成为制约城市发展的重要因素,为此,滩涂围垦拓展生存空间已成为当前解决土地紧缺问题的主要方式。考虑到滨海围垦区土质较差、软土层较厚,后期围垦填土易诱发土体不均匀沉降及水平侧向变形,造成临近桥梁及建筑物基础发生沉降、开裂、偏移等一系列岩土工程问题,严重影响桥梁等工程正常使用。然而,目前对围垦区桥梁及建筑物的桩基础受堆载影响的承载特性研究相当匮乏,缺乏系
无人机(Unmanned Aerial Vehicle,UAV)由于具有高移动、可快速部署、成本低和可建立视距通信链路等优点,使得无人机通信成为实现未来天地融合的关键技术之一。但是,无人机通信与现有蜂窝网络的融合面临着诸多问题和挑战,如无人机飞行时长短、同信道干扰加剧、空地信号易被窃取等问题。本论文深入研究了“无人机辅助的新型无线通信技术研究”这一课题,围绕无人机能耗受限问题,多无人机协作传输的同
三重摩擦摆支座在不同强度的地震作用下可以自适应地改变刚度和阻尼,因而得到广大研究人员的关注。此前三重摩擦摆支座在低层建筑和桥梁工程中已有研究和应用,鉴于高层建筑隔震需求的增长,本文对基于三重摩擦摆的高层建筑隔震以及优化设计方法开展了理论分析、试验测试和有限元分析研究。所完成的具体工作如下:(1)对三重摩擦摆支座的摩擦材料(聚四氟乙烯)进行了测试,采用双剪法得到了聚四氟乙烯在不同竖向压强和峰值剪切速
知识表示和推理(Knowledge Representation and Reasoning,KRR)是人工智能核心研究内容之一,旨在为实现基于知识的智能系统提供知识编码和问题求解的理论和技术方法。为了能够处理不同类型的知识从而能够实现对更多问题的建模和求解,研究表达能力强的知识表示语言以及配套的通用求解技术是KRR领域的一项长期关键任务。作为KRR的一种主要方法,逻辑程序的表达能力和求解技术在几
兼具流动性和导电性的镓基液态金属不仅具有独特有趣的物化性质,而且在众多的前沿科技领域展现出很大的应用潜力,如柔性电子、软体机器人、人机交互、生物医学等。如何高效地图案化这种液态的导体是其迈向实际应用的关键一步,然而其较高的表面张力以及表面氧化层的存在使得很难实现直接图案化。现有的液态金属图案化技术不仅不具有普适性,而且往往涉及到复杂繁琐的加工步骤以及昂贵仪器设备的使用。因此,发展一种简单高效且普适
近年来,随着人类迈入大规模信息和多媒体时代,人们对电子产品存储性能的要求越来越高,例如:大容量、高密度、快存取、非易失以及小尺寸等。目前基于电荷存储的存储器尺寸已接近物理极限,急需寻找一种新的存储技术突破此瓶颈。阻变存储器以其简单的器件结构、高集成度和非易失性存储性能成为新一代存储器的有力竞争者。然而在研究过程中发现,当电子器件微型化至一定程度时量子效应对器件的影响往往不容忽视。自旋电子学的兴起涉
低电压电路由于低功耗的优势受到了关注,广泛应用于物联网、智能设备等领域。而随着电压的降低,延时波动越来越大不再可以忽略,导致原有的时序分析方法不再适用,给时序分析带来了新的挑战。比如,由于延时与工艺参数的非线性导致延时分布不再服从高斯分布;由于单元种类多,导致路径中级与级之间的相关性变化很大且难以表征;由于延时与PVT的非线性关系导致需要在多个PVT下进行时序分析,同时耗费数月的时间来建立波动库。