基于深度神经网络的低光图像增强方法研究及应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:rentianyou123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是计算机视觉系统感知外部世界的重要信息来源,其质量的高低对后续计算机视觉任务的精度有着重要影响。然而,在阴天、夜晚等无法规避的低光照场景中捕获的图像,往往存在亮度和对比度低、纹理细节丢失以及噪声强烈等低质量问题。为提升低光照图像质量,现有研究基于图像传统先验或深度神经网络建立了低光图像增强模型,并取得了极大成功。然而,现有低光图像增强模型仍存在以下问题:1)忽略图像的纹理细节恢复,导致增强后图像存在纹理细节损失问题;2)未有效利用图像色彩信息,导致增强后图像存在色彩失真问题;3)增强过程中暗区域噪声被放大,导致增强后图像噪声分布更加复杂;4)过于关注图像亮度和对比度的全局增强,使图像局部区域过曝光或欠曝光,导致增强后图像存在光照不均匀问题。基于上述问题,本文主要开展以下研究:首先,针对现有模型增强后的图像存在纹理细节损失和色彩失真问题,提出了一种基于结构与纹理感知的低光图像增强方法,通过分析低光图像的全局结构和局部纹理特征的差异性,设计精细轮廓图引导的滤波器将图像分解为保留大尺度结构的全局结构特征分量和包含精细细节的局部纹理特征分量,并构建结构与纹理感知模块分别处理提取的结构与纹理特征,实现恢复全局结构信息的同时保留丰富的纹理细节信息。此外,提出颜色损失函数,有效缓解图像的色彩失真问题。大量的实验表明,本文提出的方法能有效地提高图像视觉质量并获得具有丰富纹理细节和高色彩自然度的增强结果。其次,针对增强过程中噪声放大问题,提出一种基于放大噪声图引导的低光图像增强方法,通过残差模块持续地估计增强过程中近似的放大噪声图,并将之用于指导去噪模块训练,以实现增强图像的同时去除被放大的噪声。大量的实验结果表明,本文提出的方法对低光图像增强过程中被放大的噪声,具有显著的抑制效果,能产生低噪声的高质量增强结果。再次,针对现有模型增强后的图像存在图像光照不均匀和边缘细节损失问题,提出了一种基于层次特征挖掘的低光图像增强方法,通过探索光照和边缘细节特征与网络层次特征之间的频率分布关系,构建特征挖掘注意力模块,并采用分层监督在最适宜的网络层中挖掘光照和边缘关键特征,实现亮度和对比度增强的同时还保持均匀的光照和清晰锐利的边缘细节。此外,提出非配对对抗损失函数,缓解深度监督引起的过拟合问题。大量的实验和分析表明,本文提出的方法能产生具有均匀光照和丰富细节的增强结果,且在图像质量方面优于其他方法,实现图像PSNR提升12.5%,SSIM提升3.5%。最后,针对实际场景任务开展系列低光图像增强方法应用研究,通过将本文提出的低光图像增强方法分别与夜间人脸检测任务和基于无人机的夜间行人检测任务相结合,实现夜间人脸检测准确率和基于无人机的夜间行人检测准确率大幅提升,同时获得更高的图像视觉质量。综上所述,本文针对现有低光图像增强模型增强后图像所存在的问题,基于深度神经网络模型,提出更有效的低光图像增强方法,进一步提升了低光图像质量,通过在广泛的公共数据集上与现有低光图像增强方法进行比较,验证了提出的低光图像增强方法性能的优越性。此外,夜间人脸检测和基于无人机的夜间行人检测任务的应用研究,证明了提出的低光图像增强方法的实际应用价值。
其他文献
MXenes,一类新型的层状二维过渡族金属碳化物、氮化物和碳氮化合物,作为插层型赝电容电极材料被广泛地应用于能量存储领域。Ti3C2Tx作为被研究最多的超级电容器电极材料具有高导电率、良好的亲水性、稳定性和大的层间距。虽然Ti3C2Tx作为超级电容器电极材料时,倍率性能出色并且长循环稳定性优异,但是其比容量仍有提升空间。使用具有高比容量的材料与Ti3C2Tx进行复合,可以有效提升Ti3C2Tx的比
人体行为识别技术得到了越来越广泛的应用,例如用户认证、老年人日常行为监测以及跌倒检测等。现有的行为识别方法主要基于摄像头和可穿戴传感器。这些方法虽然能实现较高的识别率,但在识别动作的过程中不可避免地侵犯了用户的隐私。基于摄像头的行为识别方法在识别过程中会捕捉用户清晰的长相信息,基于可穿戴传感器的方法在识别过程中会收集用户的生理信息,如心跳或脉搏等,这些都会带来严重的隐私泄漏问题。近些年随着WiFi
癌症极大程度地威胁着人类的健康。然而,传统的治疗方式难以达到预期的治疗效果,而且还伴随着很多副作用。因此,如何彻底治愈癌症仍然是当下研究的热点。纳米技术的发展为人类攻克癌症带来了曙光。基于纳米材料的新型治疗方式可以高效、特异性地杀死肿瘤细胞。其中,光热治疗因微创、高度的时空可控性、副作用小等优势受到了广泛关注。此外,集成像与治疗功能为一体的光热纳米诊疗剂可以实现成像导航的治疗,从而改善预后。然而,
回音壁模式(WGM)谐振腔具有紧凑的结构、超高品质因子、高能量密度等特点,以它为核心可以开发出很多高性能的光电子器件。近十年在WGM谐振腔中产生的光学频率梳,提供了一种性能更优越、实现方式更简便、更具有小型化潜力的光频梳实现方式。基于WGM谐振腔产生的耗散克尔孤子光频梳已经在光谱学、计量学、超精密测量等领域展现出巨大的应用价值。本文针对大尺寸超高品质因子晶体谐振腔加工及其应用中的一些技术难题,开展
本论文研究八元数超复分析及其应用。八元数在G2几何和粒子物理中展现出了非常重要的作用。这也激发了八元数超复分析近期的迅猛发展。针对八元数超复分析的几个关键问题,本文进行深入细致的研究。这包含以下几个方面:1.超复分析与复分析之间的关系。2.八元数Fourier变换及其实Paley-Wiener定理。3.八元数Hermitian分析中的Witt基。4.八元数Hilbert空间。我们的主要结果如下:1
本文研究处于中国制度环境下的独立董事功能的发挥和内在机制,及其独立董事对上市公司的贡献。传统观点认为,独立董事制度通过监督和咨询的双重功能提升公司价值。2001年中国证监会引入独立董事制度,要求独立董事对上市公司重大事项发表独立意见,希望借此规范公司治理、保护中小股东的权益。然而,独立董事制度在中国发展的20年中,社会上对独立董事的评价褒贬不一。独立董事制度发展于西方成熟市场(比如美国),而中国是
冻结步态是一种偶发性下肢运动障碍症状,开展准确及时的参数化监测对帕金森病等相关疾病的临床诊断、病情评估和康复治疗方案的制定具有重要作用。由于冻结步态的偶发性,在实验室环境下难以捕捉,目前依赖于量表的主观临床评估方法无法准确把握冻结步态的严重程度及时机,影响疾病诊疗,甚至可能导致漏诊或误诊。因此需要发展一种能够融入生活的冻结步态客观监测方法。惯性测量单元(Inertial Measurement U
随着无线通信、大数据等技术的发展,物联网设备的数量及其计算处理需求急剧增加,传统的以云端集群为核心的集中式处理模式在传输、计算、安全、能耗等方面凸显弊端。针对这些现实困境,边缘计算应运而生。它将计算资源靠近数据源与用户,就近提供低延迟、高安全、低成本的云边协同计算服务。相较于云计算,边缘计算优势明显,它具有更短的系统服务时延、更强的近用户端处理能力、更低的网络传输负载、更安全可靠的分散式服务架构。
图像/视频蕴含了丰富语义,是人类获取信息的主要来源之一。图像视频数据的迅速增长对信号压缩提出了更高要求,也使依靠有限人力理解海量图像成为一项挑战。计算机视觉技术的进步推动了机器分析的产业化,但机器视觉尚不具备完全取代人观察、决策的能力,人机共判场景将长期存在。在实际应用中,图像/视频多以压缩后的形式服务于存储、传输和分析,因此,图像/视频编码需要兼顾人眼视觉和机器视觉。传统图像编码致力于在有限码率
本论文深入研究C1-光滑单调非自治系统的动力学。在微分方程模型中,系统的演化经常受到周期或近周期的受迫效应影响,这些依赖于时间的受迫驱动通常被非自治系统所刻画。当系统被周期外频驱动时,方程对应的Poincaré映射生成离散动力系统;而当系统被近周期(比如几乎周期)外频驱动时,方程生成斜积系统。本文的第一部分聚焦C1-光滑强单调离散系统的动力学。我们证明了该系统的动力二分性:即,任何预紧轨道,或者渐