基于深度学习的水下图像复原技术研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:ytxiaokang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,随着陆地资源的日渐消耗,世界各国对海洋领域的探索在不断扩展。水下场景成像环境恶劣,导致水下图像中出现模糊,对比度低和颜色失真等退化现象。这些退化现象严重影响了水下场景的视觉质量,图像处理算法的准确度,以及包括海洋生态、水下交通和海洋资源勘探等领域的应用研究。由于近几年深度学习技术在图像处理领域的广泛应用,其高效而卓越的图形处理能力和对复杂映射的学习能力受到认可。因此,基于深度学习的水下图像复原技术是一个非常重要而有意义的研究课题。本文的主要内容有以下几点:第一,本文参考了大量深度学习和图像复原算法的相关文献。介绍了近几年深度学习技术和图像复原技术的研究现状以及常见算法。同时,针对各种水下图像复原算法,讨论和分析了其优缺点。为后续研究工作建立了基础。第二,针对人工光源会造成大量复原算法失效的问题,本文通过加入不均匀背景光项,改进了传统水下图像合成模型。根据修改的模型,提出了一种合成水下数据集的方法。与其他水下数据集相比,该方法合成的数据中包含了环境中的不均匀背景光成分。实验证明,由该数据集训练的监督学习模型,具有消除复原图像中因不均匀背景光导致的过度增强和过度补偿现象的能力。第三,结合图像复原任务的特征,提出了一种具有分解与融合结构的卷积神经网络,称为FMSNet。该网络中采用实例归一化操作来提升网络的域适应能力,并加入残差学习结构来促进网络的训练过程。基于高斯滤波的特征图分解模块让网络能更高效的表现图像复原。该网络结构的合理性在一组消融研究中得到证实。在训练实验中,FMSNet的训练表现也会好于一些被广泛使用的深度学习网络结构。另外,该网络的轻量级版本,称为FMSNet-B网络,能在保证较好训练表现的前提下,让网络参数数目削减约95%,且计算量下降超过80%。第四,提出一种基于FMSNet网络的图像复原算法。利用提出的合成数据集对FMSNet网络进行监督学习训练,得到的复原模型能直接将水下退化图像映射到其复原版本,不需要任何预处理和后处理操作。在合成水下图像和真实水下图像上的测试和评估结果表明,本方法与其他常见的水下图像复原方法相比,能更明显地提升图像的清晰度,并能相对准确地矫正颜色信息。利用SIFT算法的评估实验表明,经本文提出的复原方法处理后,能使原始水下图像中特征点匹配数目增加285%。
其他文献
研究表明,人类获取外界信息约80%是通过视觉获得的,双目视觉是模拟人眼视觉系统来获得现实世界信息的系统,是计算机视觉技术的一个重要分支,经过多年来的发展,在机器人视觉、反求工程、工业检测和医学成像等领域中的应用越来越广泛。立体匹配是双目视觉的一个重要环节,立体匹配的结果直接影响三维重建的效果,但是由于立体匹配过程会受到各种因素的影响,比如光照、物体遮挡和弱纹理等,会导致视差图的精度不高,如何提高视
学位
一些卫星载体的位置和形态相对于地球在不断发生着变化,多变的运动状态将影响其与地面天线的通信质量,而具有波束扫描能力的天线可以很好的解决这一问题。本文将液晶材料作为全息天线的介质,利用其电调谐能力实现波束扫描,并通过在天线顶部加载超表面来实现高增益。具体研究内容如下:1.基于液晶波束扫描的全息天线研究。研究了液晶介质的可调谐原理,通过控制液晶的偏压可实现其介电常数的变化,将液晶作为天线的介质基底即可
计算机视觉技术的进步以及激光雷达、消费级RGB-D相机、双目相机的出现,促使三维重建技术在医疗卫生、机器人技术、电力巡检、虚拟现实、犯罪现场还原、建筑基坑施工等方面有着广泛应用。传统对单个物体的重建技术已日趋成熟,三维重建技术正朝大规模、大动态的场景重建方向发展。然而,以手持三维重建设备重建小规模场景的方式不适用于大规模、大动态、存在危险的场景。四旋翼无人机具有机动性强、灵活性大等优点,非常适合替
偏振是太赫兹波的一个重要特征,传统的太赫兹波偏振转换器件尺寸较大且色散严重。超表面,是一种人工构造的超薄二维阵列平面,有利于太赫兹系统的微型化和集成化。因此,利用超表面调控太赫兹波偏振,能够有效克服传统偏振调控器件的缺陷。本文以太赫兹波偏振调控为目标,通过二氧化钒和石墨烯构建可重构超表面,实现太赫兹波偏振的动态调控。本文研究工作分为以下三个部分:1.研究了超表面实现太赫兹波偏振调控的基本理论,以及
近些年来,通信系统正逐渐朝着高速率、高可靠性和大数据传输容量等方向发展。本文依托此发展趋势和无线通信系统发展的要求,对印刷天线的宽频带/双频带技术进行研究,主要分为以下三个方面:(1)正六边形超宽带小型化印刷天线研究。该研究主要通过改变单极子印刷天线正面的正六边形辐射贴片形状与背面的地板结构来实现宽带化。最终优化的天线工作频段为3.13~29.33 GHz,带宽为26.2 GHz(161.4%),
LiAlH4虽具有较高的理论含氢量(10.6 wt%),但存在放氢温度过高、放氢速率缓慢和可逆吸氢性能差等缺点,限制其作为储氢材料的实际应用。本文通过制备Ni/C、TiO2@C、NiTiO3三种掺杂剂,并系统研究了它们对LiAlH4放氢性能的影响,主要结论如下:(1)在室温下,采用自组装反应得到了含Ni的络合物,进一步结合高温热解制备得到了棒状Ni/C材料,通过机械球磨方式将Ni/C掺杂到LiAl
随着5G的部署、物联网的广泛应用以及其他高移动应用的日益发展,对多普勒环境下的高可靠、高容量通信提出了更高的要求。将非相干抗时、频色散波形拓展到空间抗色散波形可以有效的满足高移动场景下的通信需求,但目前缺乏明确的思路和方法。针对非相干抗双色散波形的空分拓展,将非相干MIMO空分复用模型与抗双色散衰落的波形相结合,设计了一个时-频-空调制信号体制,在高速移动环境下可以获得在时、频、空域上的联合复用,
无人驾驶是保障交通安全与提升舒适驾驶的重要技术,交通场景多目标检测与分割技术在无人驾驶场景理解中起着关键作用。交通场景中随时出现的行人、车辆、交通标志以及交通灯,受到遮挡、光照不均匀以及恶劣天气等因素的影响,加剧检测与分割难度。针对多目标检测与分割准确性、鲁棒性与实时性的需求,本文应用计算机视觉与深度学习,研究交通场景多目标检测与分割改进算法,在此基础上完成了一款可搭载移动端的检测与分割智能系统。
近年来伴随着“中国制造2025”规划的逐渐落地,智能制造也快速的向着数字化、智能化和可视化方向发展,并且随着智能制造的飞速向前发展催生了物理世界与信息化的虚拟世界进行深度融合的需求,数字孪生技术作为实现物理世界与信息世界交互融合的最佳途径刚好为智能制造的发展提供了新的技术手段。本文主要针对数字孪生技术中虚拟孪生体建模还原物理世界场景时面临的速度慢、还原度低和物理世界数据驱动的实时可视化开发门槛高、