基于无监督学习的低照度图像增强研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:liuliumin3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
低照度图像因对比度低而不利于人眼观察和机器学习,尽管已经提出了不少图像增强方法来解决此类问题,但现有的算法或多或少存在一定的缺陷。例如基于Retinex模型的低照度图像增强(low-light image enhancement,LLIE)算法不仅对图像的亮度和对比度具有提升效果,而且在彩色图像增强方面具有明显的优势。然而此类算法主要对亮度分量进行估计,其结果并不准确且无法保留图像边缘信息,从而导致某些区域出现光晕或模糊的现象。采用深度学习策略实现的LLIE算法在低照度图像增强中取得了一定的成功,但此类方法必须有大量训练数据集的支持,且模型复杂度的增加会导致相应算法的时间复杂度急剧增加,增强后的图像中仍有部分区域存在过曝光和欠曝光的现象。总之,现有的LLIE算法虽然已经取得了一定的成果,但仍然不够成熟,尤其是现有的LLIE算法往往只能在某个方面比其他算法效果更好,因此针对低照度图像找到一个稳定的、鲁棒性好的LLIE算法十分重要。本文充分考虑现有各种LLIE算法的优势和劣势,从获得待融合图像质量更佳(由不同的低照度图像增强算法获得)且互补性强、图像融合过程中权重设置和所采用的Loss函数3个方面入手,提出了基于无监督融合策略的低照度图像增强算法(unsupervised fusion strategy based low-light image enhancement algorithm,UFLLIE)。在待融合图像制备上,采用选定的n个LLIE算法分别对低照度图像进行增强,得到n张图像质量有显著改善的增强图像作为初步增强图像(待融合图像)。在融合阶段,本文首先将待融合图像的RGB空间表示转换成YCb Cr空间表示,然后分别对Y、Cb和Cr分量进行融合。Y通道权重设置方面,在Y分量的融合上提出一种无监督权重生成网络(unsupervised weight generation network,UWG),该网络选用Encoder-Decoder架构作为骨干网络,以随机张量(tensor)作为骨干网络的输入,并以混合Loss函数值最小化为优化目标,从任意的随机输入开始进行梯度下降灵活设计Y通道融合的最优权重值。在Y通道融合阶段的Loss函数方面,采用增强后图像与初步增强图像之间的均方误差(mean square error,MSE)以及MEF-SSIM(multi-exposure image fusion structural similarity)损失函数共同构建混合Loss函数。Cb色度分量和Cr色度分量则分别利用加权融合技术进行融合,最后将融合后的Y分量、Cb分量和Cr分量转换回RGB空间表示,从而得到最终的增强图像。此外,在有大量训练数据集的情况下针对某些特定的图像可以采用有监督的卷积神经网络(convolutional neural network,CNN)与无监督的UWG网络形成互补,即对经过UFLLIE算法增强后的图像利用CNN网络进行再次增强,从而获得质量更佳的图像。为了验证所提出的UFLLIE算法对低照度图像的增强效果,分别在从各个文献中收集的低照度图像(没有无失真的图像)和SICE数据集(有原始无失真图像)上与目前主流的LLIE算法进行比较,并采用4个无参考和2个有参考图像质量评价指标衡量各个算法的增强效果。实验结果表明:与现有主流LLIE算法相比,UFLLIE算法在各项评价指标上均排在前列,整体性能好且能够很好的保留图像细节信息。
其他文献
农业领域数字化和智能化是国家数字化建设战略的重要组成部分。农业发展离不开农药,食品安全中涉及的农产品的农药残留量关乎人民生命安全和身体健康。因此,基于人工智能技术实现农药知识自动问答系统是有意义的。针对农业从业者和农产品消费者对农药知识的了解和使用方面困难突出,以及目前农药知识相关知识服务比较缺乏问题,本课题致力于通过构建农药知识图谱,设计并实现农药知识自动问答系统来提供农药知识服务,提出了利用深
学位
医学图像分析的第一步都是确定组织,因此,对于许多医学分析算法而言,背景去除是获得有效和准确结果的先决条件。尽管对操作人员来说识别WSI的组织区域是一项非常简单的事,但对于计算机而言可能是具有挑战性的,这主要是由于WSI存在颜色变化和伪影,而且,难以检测到诸如肺泡组织,脂肪组织和染色不良的组织。癌症区域分割是病理医生计算癌症阳性率并分析癌变症状的基础,因此癌症区域分割结果的好坏会直接影响到病理医生的
学位
互联网在给人们提供巨大便利的同时,其数据真实性、完整性等问题也随之出现。由于互联网数据易被篡改、被破坏,管理方难以维护其真实性与完整性。而区块链技术有着去中心化、防篡改、安全透明等天然特性且具备高公信力,可有效确保数据完整性、真实性,非常适用于数据存证类应用场景。因此,各方都寄希望于区块链以满足其存证需求。但若各应用场景都建立、维护各自的底层链,便会造成数据孤岛、底层链耦合度高、通用性差等问题。本
学位
缺陷检测是工业上非常重要的一个应用,与此同时,卷积神经网络在特征提取和定位上取得巨大成就。因此深度学习在目标检测领域取得了长足的发展,使得瓷砖表面缺陷检测成为一个有潜力的研究方向。但是瓷砖瑕疵检测依然受到检测目标中小目标较多,形状多变且不规则,特征不明显等因素的困扰,企业在生产制造的过程中依然无法避免的生产出具有各类瑕疵的瓷砖。如何解决以上种种问题,提高小目标瑕疵检测的精度是亟需解决的难题。本文主
学位
人脸表情作为一种表达情绪的载体,在日常人际交往中起到了重要作用。现如今,人脸表情识别技术广泛应用于人机交互、智慧驾驶、医学等领域。随着深度学习技术的发展,基于卷积神经网络的方法正成为主流的表情识别方法,但依然存在表情识别准确率不高以及不同个体之间的脸部特征和表情差异大等问题。针对上述问题,本文进行了人脸表情识别研究,主要研究工作如下:(1)针对VGG16深度卷积神经网络存在表情特征提取不够充分的问
学位
帕金森病作为一种慢性的神经退行性疾病,其导致大脑中的黑质和纹状体发生病变,由此产生的相关症状严重影响了患者及其家庭成员的正常生活。鉴于帕金森病当前仍无法被治愈。因此,精确、可靠的早期诊断方法对于减缓帕金森病的进展、改善患者健康状况发挥着至关重要的作用。面部表情障碍作为帕金森病的早期运动症状之一,使得帕金森病患者与正常人在面部表情表达上存在明显差异。在临床诊断中,由于面部表情障碍评估任务主观性较大,
学位
图像去模糊的研究已经有了诸多进展,深度学习在图像去模糊领域上也颇有建树,但是纵观深度学习的去模糊方法,或是因为模型结构较为简单,导致去模糊的效果难如人意,产生了诸如伪影、丢失边缘纹理等问题;或是因为模型结构过于复杂,导致其适应性较差,难以将其广泛应用于各类场景中。在这一背景下,本文基于经典的深度多尺度卷积神经网络(DMCNN),提出了一个相对轻量级的多尺度去模糊网络。本文所做的主要工作如下:(1)
学位
为将中餐食物图像检测模型部署在移动端设备上,本文提出了一种基于优化YOLOv4的中餐食物图像检测模型,并通过实验证明其有效性。之后,基于所提出的模型,设计并实现了一个中餐食物图像检测系统。本文的主要研究内容及工作如下:1.针对传统目标检测模型占用资源较多,轻量检测模型精度较低等问题,本文首先从轻量化的角度出发改进YOLOv4模型,一方面使用轻量化神经网络Mobile Net V2替换原始YOLOv
学位
随着大数据时代的到来,图像尤其是动物图像已经成为网络数据的重要组成部分。从已有的海量数据中有效地检索出动物图像,对于发现动物和保护动物具有重要的意义。由于科学技术的发展,现如今的图像检索普遍是基于内容的,近些年更是将深度神经网络与图像检索结合以获得更准确的检索结果。但是基于深度学习的方式获取的图像特征往往维度很高,而利用这种高维度的图像特征进行检索,在实际应用中往往会带来难以接受的时延问题。基于上
学位
<正>众所周知,《黄帝内经》是我国最早的医书之一,里面记载了很多古人的养生之道,今天笔者就带大家来看看古人在寒冷的冬季是如何养生的。《黄帝内经》中关于冬季养生是这样记载的:冬三月,此谓闭藏。水冰地坼,无扰乎阳,早卧晚起,必待日光,使志若伏若匿,若有私意,若已有得,去寒就温,无泄皮肤,使气亟夺,此冬气
期刊