基于多合一模型和深度先验的图像去雾算法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:huhf1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
雾霾是一种常见的大气现象,是空气中悬浮的微小颗粒物(灰尘、烟、微小水滴等)组成的气溶胶系统。在户外拍摄图像时,雾霾的存在常常会使得拍摄的图像出现对比度降低、整体色彩变淡等现象,导致图像的可视化效果变差,影响到后续的高层计算机视觉任务。因此,去除图像中雾霾的影响是一项很有意义的研究。对于图像去雾问题的研究,主要有基于图像增强、基于物理模型和基于深度学习这三种类型的方法。基于增强的方法属于较早期的研究思路,后两类则是当前阶段主流的研究方法。基于物理模型的去雾算法,大多数采用大气散射模型,先分别估计大气光强度和透射率,然后再间接地恢复出无雾图像。然而,估计多个变量可能会造成单个变量估计时的误差在去雾结果中累积。大多数基于深度学习的去雾算法依赖于深度网络在合成数据上的学习能力,然而合成数据分布和真实数据分布不一定相同,真实有雾图像的情况往往更加复杂。针对以上存在的问题,本文提出了一种基于多合一模型的自监督神经网络去雾算法。首先,本文使用了大气散射模型的等价版本——多合一模型,该模型将大气光和透射率整合为一个变量,避免了估计多个变量带来的误差累积问题。基于这种思路,本文制定了一个神经网络去雾算法模型。其次,本文使用一种深度图像先验作为模型中无雾图像的隐式先验,设计了一种手工先验作为模型中整合变量的显式先验,将模型的求解转变为了一个约束优化问题。最后,本文使用两个深度图像先验生成网络对该优化问题中的无雾图像和整合变量进行求解,采用联合优化的策略,以自监督学习的方式同时更新两个网络,避免了监督学习方法对大规模合成训练数据的依赖。在合成数据集和真实数据集的实验结果表明,本文的算法在量化指标和可视化结果上都达到了目前一流算法的水平。
其他文献
近年来,数据驱动型算法逐渐成为了计算机医学影像分析方法的主流。目前的数据驱动算法主要侧重于学习输入数据与输出结果之间的映射关系,未能有效利用高层次的知识信息。在医学影像分析领域,高层次知识包括医生多年总结的诊断经验、人体器官形状知识、解剖特征点位置知识等,这些医学知识对于影像分析具有重要参考价值,却很难通过数据驱动型算法直接学习得到。本论文通过融入医学知识来提升医学影像分析算法的性能,在图像分割、
拓扑优化是结构优化方法的一种,是设计中的重要步骤,其目的是在设计域内为给定量的材料做最佳分布,该工作除了为设计者在概念设计阶段提供参考,还可对现有设计方案做进一步优化。伴随着20世纪以来的自动驾驶以及航空工业的发展,拓扑优化在越来越多的学科有了广泛的应用。拓扑优化的经典方法为SIMP算法,然而该方法的迭代次数多,收敛较慢,且运算复杂。为了解决这些问题,本文受到前人工作的启发,将传统的优化问题看作图
在土工三轴试验的力学性能测试过程中,土样体积变化的测量是非常重要的环节。对于饱和土,土样体积变化的测量技术相对成熟,可利用量筒间接测量流体吸入或排出饱和试样的体积来实现。然而,对于非饱和土,土样内部不可避免地存在空隙、气泡等,传统饱和土体积变化的测量手段已无法准确测量非饱和土的状况。数字图像技术因其测量精度高、不扰动试样,在土样体积变化测量方面具有显著的优势。本论文引入数字图像测量技术开展土样体积
单目深度估计是计算机视觉领域中一项重要而具有挑战性的任务,而且在三维场景重建、无人驾驶、医学图像处理、现代化军事以及智能交通系统中都发挥关键性作用。其目的在于估计出RGB图像中每一像素点的深度信息。基于深度学习的深度估计流程为:首先输入一张二维图像,然后进入卷积神经网络即编码器-解码器结构,最后估计出图像中场景的深度值。在深度估计的过程中,网络模型的精确度往往会受到图像尺度与场景环境的影响。尽管目
使用社交媒体平台是如今大部分人日常生活的一大特色。人们喜欢在互联网上分享自己的感受、趣闻轶事、大事小情,包括自己的身体状况、病情、用药等等。这同时也为自然语言处理工作带来了源源不断的数据资源。健康已经成为全世界最为关注的问题之一,它与我们每一个人都息息相关,并且在生活中扮演越来越重要的角色。将机器学习以及深度学习方法应用于生物医学领域是一种新的发展趋势,并将带来更大的发展。而社交媒体数据是由用户自
为满足我国近年来航空航天事业的发展需要,对大型构件的高效高精加工提出了新的要求,而数字化测量技术是保证加工过程高精、高效、高鲁棒的关键。目前,国内外航空航天业已经对工业生产中的测量技术进行了大量研究,其中视觉测量作为一种非接触式测量方法,具有数据采集快速、高精高效、便于移动、能够三维测量等优点,受到了工业界的充分研究和重视。本文主要研究了基于双目视觉的大型航空航天构件加工过程中局部加工定位点的高精
轻量级区块链继承了传统区块链的优势,对数据的安全性加以保障,同时结合移动边缘计算理念,避免了对计算和存储资源的过度依赖,满足了车联网边缘节点的实际需求。恰当的人工智能算法可根据车辆需求和上报数据的变化,有效地决定和分配不同地区的数据缓存,以避免数据与地域兴趣不匹配,从而间接影响车辆行驶过程中的数据卡顿等问题。本文结合现有的车联网特点和区块链技术,提出了一种轻量级区块链应用于车联网的架构,并引入协同
定制产品设计和生产制造过程中,制造商常邀请用户通过虚拟体验等方式感知产品性能。通过分析用户完成产品体验后发表的用户评价,了解产品设计的不足与缺陷,从而有针对性的完善产品性能,使定制产品更加适应用户需求。情感分析技术是一种基于句法分析和机器学习的文本观点提取与情感判断方法,在文本数据分析处理过程中,它可以基于文本数据近似模拟出文本特征与其情感倾向的关系。与人工分析文本相比,文本情感分析技术能够有效缩
目前,随着信息时代的高速发展和计算机计算能力的不断提高,人机交互的情绪识别是发展最快的研究领域之一。为了提高人机交互的效率,增强计算机识别情绪的能力是十分重要的。当前情绪识别的研究大多集中于人的面部表情、声音、文本等方面,而人体运动的情绪识别任务较少受到关注。然而,日常生活场景较为复杂,可能出现面部表情、语音等失效的情况,这时空间尺度更大的肢体动作情绪识别往往能够发挥更大的作用。现有的情绪识别数据
近年来,国家司法改革不断深化,随着司法机构数字化程度不断提高,法律文本数据信息出现了指数级的急速增长,海量司法文书的高效分析与处理成为亟待解决的问题,相关问题的研究也受到研究者的广泛关注。法律文书的命名实体识别,作为司法人工智能领域的关键性和基础性的工作,在法律问答、刑期预判和司法知识图谱构建等任务中起着重要应用。命名实体识别的研究推动了司法人工智能下游任务的发展,但目前司法命名实体识别的研究还处