基于生成对抗网络和自注意力机制的图像语义分割

来源 :青岛大学 | 被引量 : 0次 | 上传用户:yolandaguyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是一种视觉场景理解任务,目标是预测输入图像中每个像素的类别标签,从而实现在像素级别上的物体分割。语义分割被广泛应用于自动驾驶、机器人技术、医学影像分析和视频监控等领域,因此提升图像语义分割的效果和精度具有重要的理论研究意义和现实应用价值。现有研究表明图像语义分割的精度受到已标注的样本数量以及模型结构设计等因素的影响,当前研究方法在一定程度上均存在依赖大量标记数据和对上下文信息利用不充分等问题。针对上述问题,本论文进行了如下两个方面的研究工作:第一,提出了一种对抗训练方法来强化语义分割模型的分割效果。借鉴生成对抗网络(GAN)的框架结构,构造全卷积的语义分割网络以及判别网络,通过判别网络检测和纠正真实标签与分割图的高阶不一致性,达到提高分割精度的目的。整个语义分割网络通过耦合分割损失和对抗损失进行训练。为了解决语义分割数据集需要大量的人工标注的问题,在对抗学习增强分割结果的基础上,利用判别网络提取分割结果中的可信任区域,生成伪标签,协助网络进行训练,从而实现半监督图像语义分割。第二,提出了一种基于自注意力机制的语义分割模型。为了能够自适应提取上下文信息、捕捉随着网络层次的深入逐渐丢失的空间结构信息,将自注意力机制引入图像语义分割并且与空间金字塔池化模块结合,自适应地根据空间金字塔池化模块提取的不同尺度的特征对象来提取全局上下文信息。为了克服经典注意力模型在提取上下文信息时存在参数量过多的问题,本文使用了十字交叉注意力方法,在提取信息时只考虑水平和垂直两个方向上的信息。通过串联该模块可以做到以更有效的方式从全图像依赖中捕获环境信息。
其他文献
目前,我国传统制造业处于生产模式转型的重要阶段,逐渐由大批量、流水生产模式向多种类、小批量柔性生产模式转型,对企业实现高效、智能化生产提出了更高的要求,因此,出现了分批调度问题(Scheduling With Lot Streaming Problem,SLSP)。SLSP的研究对车间智能生产具有重要的学术价值和工程意义。结合已有的文献资料,进一步研究了考虑批量流(Lot-Streaming,LS
在钢铁行业中,高炉渣作为高炉炼铁的主要副产物,出炉温度在1500℃左右。工业中常用的水淬法无法实现其高温显热的回收利用,水淬法还会造成环境污染与资源浪费。为解决上述问题,高炉渣机械离心粒化及热回收工艺成为当前研究的热点。为实现高炉渣的资源化回收利用,该工艺要求粒化渣粒的平均粒径小于2mm并实现对离心粒化过程的自适应控制。为满足工艺要求,研究提出了基于神经网络PID的高炉渣离心粒化控制方法,在分析离
本文对具有输入时滞的非线性系统进行了自适应神经网络控制。根据自适应神经网络控制方法、Backstepping设计思路和Lyapunov稳定性理论,在系统具有状态时滞和输入时滞的条件下,设计状态反馈控制器。并考虑了具有输入时滞条件下系统的输出反馈控制方案。主要针对非严格反馈非线性输入时滞系统考虑了控制设计以及闭环稳定性分析问题。利用积分变换和辅助系统方法,给出了两种控制设计方案。具体研究内容如下:1
目前,游泳池溺水检测是基于摄像头的人工监控,这不仅耗费人力、容易漏检、误检,并且受人类情绪和疲劳等因素而影响监控的效果。少数的溺水检测是基于计算机视觉的自动监控,其中具有代表性的算法是背景减除法。但该算法检测速度较慢,只有5fps左右;检查精度较低,只有60%左右。这些问题使得溺水现象无法及时、准确地被检测,导致溺水者无法得到及时救援。针对上述问题,本文用深度学习方法对基于计算机视觉的自动溺水检测
5G技术的兴起,使得智能可穿戴产品在人体健康监测、运动检测以及人机交互等领域扮演越来越重要的角色。作为智能可穿戴产品的重要组成部分,应变传感器在感知外界刺激、获取数据信息方面发挥着重要作用。目前,应变传感器的研究主要致力于工作范围、灵敏度、响应时间以及工作稳定性等性能的提升。纤维基柔性应变传感器因其较大的比表面积、较轻的质量、优良的透气性、优异的柔韧性和可拉伸性及可编织性等特点,引起了研究人员的广
受自然界中群体行为的启发,控制科学领域的学者们开始对非线性多智能体系统进行一致性研究。多智能体实现一致性所用时间是一致性控制问题的评价指标之一。与渐近稳定相比,有限时间稳定不仅使系统在更短的时间内实现控制目标,而且使系统具有更好的鲁棒性和更强的抗干扰能力。本文主要研究非线性多智能体系统的有限时间一致性控制问题和固定时间一致性控制问题。具体内容如下:第一章介绍了多智能体系统一致性问题的国内外研究动态
磁共振成像是一种非侵入式的活体成像技术,拥有对比度高、无辐射等优点。清晰的图像可为临床诊断提供依据。在实际扫描过程中,患者移动、设备噪声等因素会导致图像质量下降。超分辨率重建技术可在不改变硬件设备的条件下提高图像质量,拥有成本低、重建质量高的优点,在医学图像重建领域有着重要的应用与研究价值。本文针对现有超分辨率重建算法的不足展开如下工作:1)为解决重建图像纹理不够清晰、不真实的问题,本文将纹理迁移
随着可穿戴电子设备的日趋普及,通过能与人体发生充分交互作用的纺织品与电敏感材料整合所制成的“电子纺织品”,实现对人体与外界环境之间发生的电力学转换、热湿交换、温度与热量传递、光吸收与发射等物理指标信号进行数字化识别和传输,是传统纺织品向智能化、信息化发展的重要研究课题。其中利用纺织品独特的结构特点制备的应变传感器,更具有实际的应用前景,如对心跳、脉搏、呼吸、发音、肢体动作等生理和运动指标进行监测。
随着通信网络的发展和计算机技术的进步,控制模式开始由传统的点对点模式向网络化模式转变,形成了一种通过共享网络来实现控制器、传感器和估计器等各节点之间信息传输的控制系统—网络化控制系统(Networked Control Systems,NCSs)。目前,虽然针对NCSs的研究已经取得了大量成果,但仍有一些问题没有得到很好的结论。例如怎样解决约束下的最优状态估计问题?如何给出分布式系统中各传感器的信
随着人工智能的发展,多智能体的协同控制在机器人协作、飞行器编队和柔性制造等诸多方向的应用都有良好的前景,受到越来越多的关注。本文研究了非线性多智能体系统在非严格反馈结构下的双向一致性以及包容控制问题。针对合作竞争多智能体系统,在输入饱和存在时提出了能够在有限时间内实现双向一致性的控制策略。针对系统中状态不可测量的情况,提出了基于神经网络状态观测器的自适应有限时间包容控制策略。论文研究的主要内容概述