基于无监督注意力机制引导的图像去雾方法研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:tanli357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
室外的场景通常有大气中的混浊介质存留,由于大气的吸收和散射形成了雾霾。图像采集设备受到雾霾的影响,导致获取到的图像清晰度降低、对比度下降,严重时还会导致色彩和细节信息发生变化或失真。近年来,计算机视觉技术已经普及和深入到各个行业的应用当中,在道路、航空等领域发挥着越来越重要的作用,而雾霾天气严重威胁了交通的安全。为了各类计算机视觉系统在雾霾环境下能正常工作,使得后续开展的图像分割、目标检测、图像识别等算法能有效运行,对雾天图像进行清晰化处理和研究具有重要的现实意义。传统的图像去雾方法大多基于大气散射模型或先验知识,但这些并不总是适用,且模型参数无法进行准确的预估,导致去雾结果常常出现颜色失真、效果不佳等问题。深度学习算法的出现使得网络能自动学习模型的参数或图像去雾的任务,而基于生成对抗网络的去雾方法甚至可以无监督、端到端地生成清晰的图像。但以往的去雾网络并没有考虑到真实雾霾图片中不同区域浓度不同的特点,仅仅进行图像的整体变换,导致图片去雾不均匀、细节较差且出现偏色等问题,无法得到很好的效果。针对上述问题,本文提出了一种新的去雾方法,本文的主要研究内容包括以下三个方面:(1)探究了注意力机制与去雾的联系,并提出了基于暗通道的注意力机制。本文将以往运用在图像局部转换的空间注意力机制应用于图像去雾中,并通过实验探究了注意力机制在图像去雾中的可行性。同时,本文受到暗通道算法的启发,针对原有注意力机制在图像去雾中的局限性,创新性地提出了一种增强的暗通道注意力机制来实现对雾霾区域的关注,并通过实验验证了该机制的有效性。提出的注意力机制能够准确且快速地标注出雾霾的浓度与区域,使得网络分区分量去雾成为可能。(2)构建了两种基于注意力的去雾网络。在原有循环生成对抗网络的架构上,针对图像去雾的目标改进了生成器和判别器的网络结构,并将提出的暗通道注意力机制与其相结合,依托一种循环生成过程构造了两种基于暗通道注意力机制的去雾网络。所提出网络避免了传统生成对抗网络对图像整体转换导致的图像颜色失真、细节还原不佳的问题,能关注到不同雾霾浓度需要转换的程度不同这一特点,更多地保留了原图的细节特征,更好地还原了原图色彩,提升了去雾效果。本文通过大量的对比实验验证了所构造去雾网络的有效性。(3)探究了多类图像去雾的鲁棒性。本文以实际去雾的应用场景为背景,根据图像采集设备全天候采集这一特点,将实际去雾操作中可能遇到图像分为三类,并验证了本文方法和对比方法针对三类图像转换的鲁棒性。本文网络结构在各种场景下相较于以往算法都有显著的改进和提升。在多雾,少雾,无雾的目标图片上,都能进行有效处理并得到符合预期的转换效果,对实际应用下复杂场景的混合去雾任务具有重大意义。
其他文献
濒危动物的保护对维持生物多样性至关重要。如果无法有效保护濒危动物,可能会导致地球生态系统失衡。随着全球变暖的加剧,濒危动物栖息地的丧失,濒危动物的保护变得越来越严峻。如果能及时并准确地识别濒危动物个体,就可以长期跟踪了解动物及其种群的行为和生活状态,从而更加有效地保护它们。为了确定某一只动物的身份,目前常采用的方法有人工目视检查、收集动物的排泄物或生物学样本、在动物身上附着传感器或者在体内植入微电
大坝水利工程作为最重要的水利工程之一,有利于调节河流径流,改善库区气候,也可以用于防洪、航运、发电、灌溉、水产养殖、旅游等重大工程。然而,大坝水利工程的体量一般很大。一旦发生事故,后果不堪设想。在水利水电建设工程中,灌浆工程是地基防渗和加固的重要工程措施,同时也是许多地下工程提高地基承载能力和防渗能力的技术手段。随着大坝水利工程数量的不断增多,工程所处地理位置的地质条件更加复杂多变,对灌浆工程质量
军事复杂软件系统继承了复杂软件系统和军事应用的双重复杂性,同时还受到军事领域的外部规则限制,形成了相对封闭的软件生态系统。2017年以来,美军加快了软件采购与开发方面的改革,2020年正式发布了“自适应采办框架(AAF)”在包括软件在内的6个领域全面实施“敏捷采办”,在“软件采办路径”中明确“政府和软件承包商应当采用‘现代迭代软件开发方法’”,下步将会全面实施敏捷开发、精益实践、Dev Sec O
随着信息化进程的加快,以人工智能为代表的新兴技术学科正不断演进发展。人脸识别技术作为人员辨别的重要表达,在生物识别领域中有着重要的研究意义。同时,其以非接触式识别的特点在监控、安防等工业生产领域得以广泛应用。目前,基于二维图像的人脸识别技术有着最普遍的运用,但由于二维人脸识别常受到光照、妆容、姿态等因素影响,从而导致识别效果不佳。相比而言三维人脸数据由于具有空间信息,在一定程度上可以解决二维人脸识
非限制场景下的人脸检测识别系统一直都是计算机视觉领域的一大挑战,特别是随着新型冠状病毒的流行,大量的人们戴上了口罩,需要一种不仅能够对非限制场景下人脸进行识别,还要能够对戴口罩的人脸进行识别的方法。本文提出一种基于人脸检测、遮挡物定位、人脸修复、人脸识别四个步骤的人脸识别方法。针对非限制场景下的人脸检测、人脸修复提出改进方案,同时标注了一种针对人脸遮挡物定位的数据集,最后整合四个步骤提出遮挡人脸识
医学图像处理作为学术界和业界的长期关注领域,具有很高的科研及应用价值。在医学临床实践中引入计算机辅助诊断系统,可以有效地减轻医生的工作压力,同时提高临床诊断准确率。伴随着人工智能技术的高速精进,基于神经网络的医学图像处理也越来越广泛地被应用到临床诊断中。基于神经网络的计算机辅助诊断系统大多依赖于海量数据进行训练学习,以实现令人满意的诊断判别效果。但是在实际生活中,很多疾病很难获取到大量有效的数据来
在视觉信息退化的环境中实现机器人的定位和导航,是目前视觉里程计的研究热点之一。目前大多数的视觉里程计基于可见光图像,只能在光照条件良好的环境中工作,当工作在夜间、雾天、浓烟以及粉尘等环境时,难以从连续的可见光图像中建立鲁棒的运动估计。热视觉里程计使用热图像作为视觉传感器输入,在上述视觉信息退化的环境中也能够鲁棒地工作,热视觉里程计能够帮助机器人实现弱光、烟雾等恶劣环境下全天候的定位和导航,这对于拓
时尚分析在时装产业、精准营销、社会行为分析等领域具有巨大的潜力,近几年越来越受到人们的关注。目前的时尚分析工作大多集中于分析服装的流行风格与流行趋势,而很少有学者关注人脸妆容的流行元素。人体的软生物特征提供人体中级描述,可以根据属性划分出具有某个特质的人群,如人脸具有多种属性,包括性别、年龄、种族、发型、发色等。本文主要致力于通过对人脸软生物特征的分析来获取唇色和发色的流行色。对于此任务,本文主要
基于视频的单目标跟踪作为计算机视觉研究领域中的基础性研究一直广受关注。通过提取视频初始帧提供的目标信息及其周围的背景信息,目标跟踪算法对后续帧中目标可能出现的区域进行预测。单目标跟踪的应用价值在多个领域都有充分体现。因此,继续对单目标跟踪算法进行深入研究依然十分重要。由于卷积神经网络在计算机视觉领域中的优越表现,现在主流的单目标跟踪算法的研究大都基于卷积神经网络进行方法设计。然而,基于卷积神经网络
飞行模拟机是训练飞行驾驶员在地面上虚拟飞行的有效设备,飞行模拟机给飞行驾驶员带来真实感的原因之一就是它逼真的视景系统,可以将飞机上可见的一切视景以虚拟的方式呈现在飞行驾驶员的眼前。当训练飞行驾驶员时,除了起飞和降落的场景都是在空中,所以云是飞行驾驶员在空中最常遇见的场景也是飞行模拟视景仿真中不可或缺的场景。相对于游戏或影视中的三维云场景而言,飞行模拟机中的三维云场景有着不一样的需求,第一,云层在飞