无参考图像质量评估新方法研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:hopemaoelgin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像质量评估(Image Quality Assessment,IQA)是对失真图像的质量进行量化并输出与人眼视觉系统相一致的质量分数。无参考图像质量评估是无需参考图的前提下对各种失真图像建立感知模型,通过感知模型探索计算机与人眼视觉对图像质量理解的关系。无参考图像质量评估是图像处理领域的基础,它主要分为两大研究方向:(1)对图像的直接理解与感知,探索计算机视觉与人眼视觉的一致性;(2)利用质量信息,辅助提升基准图像处理任务的精度。本学位论文正是围绕图像质量评估的这两大方向展开研究,具体工作如下:(1)提出了一种基于精炼自然场景统计(Nature Scene Statistics,NSS)的无参考图像质量评估方法。现有的基于NSS的图像质量评估方法通常从同一个信息域提取质量特征,如离散余弦变化(Discrete Cosine Transform,DCT)域、小波域或空域。然而很少研究者探索不同信息域下质量特征的联动性。本文提出一种新的基于精炼NSS的无参考图像质量评估方法(Novel Blind IQA,NBIQA),NBIQA根据Benford定律在DCT域中提取质量特征,并融入现有方法在频域和空域的质量特征建立支持向量回归(Support Vector Regression,SVR)模型。理论分析和实验结果都表明,提出的Benford质量特征对图像质量具有强相关性,而且NBIQA方法在合成失真与真实失真方面都优于现有的基于NSS图像无参考图像质量评估方法。(2)提出了一种基于可控列排序学习的无参考图像质量评估方法。真实世界的图像通常包含各种类型的失真。不幸的是,现有的质量评估方法并不能有效处理所有类型的失真。本文提出了一种基于可控列排序的通用无参考图像质量评估方法(Controllable List-wise Ranking for IQA,CLRIQA)。CLRIQA首先设计了启发式方法(Imaging-heuristic approach,IHA)模拟真实失真获取退化图像,从而达到数据增广的目的。然后,根据退化信息设计一个可控列排序的损失函数去训练质量排序网络。最后利用带质量标注的数据集进行回归微调。在多个质量评估基准数据集上的测试结果表明,CLRIQA方法的性能均超越现有的基于排序学习的无参考质量评估方法。(3)提出了一种基于相似度分布的无监督人脸图像质量评估方法。以往的人脸图像质量评估研究大多以样本层面不确定性或配对相似度作为质量评分,他们只考虑部分类内信息。然而,这些方法忽略了来自类间的有价值的信息。本文提出了基于相似度分布的无监督人脸图像质量评估方法(Face Image Quality Assessment with Similarity Distribution Distance,SDD-FIQA)。SDD-FIQA首先通过衡量人脸识别模型性能的误差拒绝曲线从理论上导出了人脸图像质量与其类内-类间相似度分布距离直接相关。随后利用Wasserstein准则度量类内-类间相似度分布距离,并用来生成质量伪标签。最后利用质量伪标签训练质量回归网络。测试在基准数据集上的大量实验结果表明,提出的SDDFIQA的性能达到了当前最先进的技术水平。同时,我们的方法在不同的识别系统中都有很好的泛化效果。
其他文献
培养学生的绿色环保意识和可持续发展意识是应用化学专业本科人才培养方案的基本要求之一。目前实验教学中培养学生绿色环保和可持续发展意识的实验项目较少,针对这一问题,在综合化学实验中增加本新创实验项目。实验以废弃菜籽油和甲醇为原料,氢氧化钠和氯化胆碱为催化剂,生成的副产物甘油与氯化胆碱原位形成低共熔体系,与产品形成液-液两相,促使反应正向进行,简化后处理,提高产品纯度和产率。GC-MS (Gas chr
随着深度学习理论及相关技术的发展,深度学习模型已经广泛应用于各种实际场景中。不仅图像领域中的目标检测、图像分类、人脸识别等典型的应用场景使用深度学习模型,越来越多自然语言处理的应用场景都在尝试使用深度学习模型,如情感分析、垃圾邮件分类以及机器翻译等。但是深度学习模型在面对对抗样本时表现出很严重的脆弱性,即使在原始数据中加入一点小小的改动都会影响模型的输出。近年来,研究者通过向原始数据中加入人肉眼难
DNA链置换技术推动了DNA计算研究的发展,在DNA计算机的研究中起着至关重要的作用。DNA链置换反应为开发分子计算提供了一套智能工具箱,尽管基于DNA链置换反应的逻辑门电路已经达到了很高的复杂性,但实际可实现的计算任务的扩展仍然是一个障碍。开关电路最初由Shannon于1938年提出,现在广泛应用于电信领域,是实现高速、高带宽通信的一种有效手段。本文研究开发了一种基于DNA链置换反应的DNA开关
目前,国家正积极推进区块链技术和经济社会的融合发展。然而,数字货币作为数字经济基础设施,其保护隐私的特点使其成为了犯罪分子开展非法活动的“温床”。该现象为国家促进数字经济发展,打造安全、稳定、健康的金融环境带来了挑战。因此,从海量交易数据中识别异常交易带来的安全风险,形成监管体系,推动数字经济健康发展,已成为目前数字货币监测监管的重要挑战之一。数字货币的交易账本均是公开访问的。目前,针对数字货币异
作为一种直观自然的交互方式,手势日渐从人际日常交流向新型人机交互发展,尤其是在车载控制系统上,不少高端车型已将手势识别技术应用于搭载的车载影音娱乐系统。在众多技术实现路线中,基于单目彩色摄像头的机器视觉方案因为所需的传感器简单便宜,越来越被研究者们所注意。为解决手势图片背景复杂、自遮挡、易形变等识别困难,本文利用深度学习技术提高其识别准确率。为了解决上述问题,本文设计了基于单目彩图的深度学习手势识
深度神经网络已经被广泛地应用在各个领域,但是对抗样本的存在对神经网络的应用造成了极大的安全隐患。迄今为止,许多针对深度神经网络的对抗攻击方法已经被提出来,但是这些方法依然存在很多不足之处。例如,基于梯度的攻击方法,攻击的成功率和效率都很高,但是图像修改的幅度也很大。而基于优化的或者单纯修改少量像素点的攻击方法,虽然减小了图像修改的幅度,但是由于需要进行大量的计算,攻击的效率不高,并且成功率较低。此
本研究利用苯酚—氯仿—异戊醇—核糖核酸酶法,从3个品种豇豆幼嫩叶子中分离出总基因组DNA,参照已知的几种Bowman—Birk型胰蛋白酶抑制剂基因序列和ATG起始位点,设计合成了两段长度为27bp且5端含有BamHI位点的寡核苷酸引物。以总DNA为模板,进行PCR扩增,得到长度约为340bp的均一特异性扩增产物CPTI DNA片段。 将该片段克隆到质粒载体pGEM—3zf(+)的BamHI位
互联网技术的发展,催生了大量平台级的应用服务,如搜索、推荐、查询等。为了向用户提供更加精准、高效的服务,众多互联网平台分别构建了面向不同应用场景的知识图谱。知识图谱是一种组织结构良好、可解释性强的人工智能技术,能高效地组织并表示各种信息,因此得到了广泛的应用。但面向各不同网络应用的知识图谱通常是独立构建的,因此存在相同的信息表述不一致以及数据的更新时间不一致等问题。将不同时间的知识图谱中表述形式不
人们日益增长的物质需求与环境污染和能源短缺的问题相矛盾,目前可再生的清洁能源如风能、太阳能等也需要高效的储能装置。锂离子电池(LIBs)是目前能够商业化大规模应用的可循环使用的电池设备。在未来几十年将被普遍运用于各种电子移动设备和新能源汽车。然而稀缺的锂资源使人们将目光转移到钠离子电池(SIBs)研究上。由于离子半径等物理特性差异,传统正负极材料并不适用SIBs。二维层状MXene材料具有独特的物
随着互联网的日益普及,智能终端越来越依赖于网络来提供应用服务。然而,这种对网络的高度依赖,造成了在缺网、断网、网络环境差等极端场景下,智能终端无法提供有效的服务。此外,常见的交互技术存在控制方式机械、固定和单一,全局性和实时协同性差,智能程度较低,用户交互性和参与性较弱和个性化不足等问题,这在很大程度上影响了用户的体验。因此,本文针对现有感知和泛在交互技术存在的障碍和限制,设计和实现了一套适配多样