【摘 要】
:
图像质量评价是指通过对图像进行相关特性分析,量化视觉失真程度,得到其质量分数的过程。无参考图像质量评价旨在不提供原始图像信息的情况下,对失真图像进行质量评价,其更接近于实际应用并且更具挑战性。通过无参考图像质量评价,可以更好地监控图像质量并进一步引导各种图像处理系统的优化。自然图像和屏幕内容图像是图像质量评价领域的重点研究对象,故本文主要围绕这两类图像来设计合适的无参考质量评估算法。由于目前基于卷
论文部分内容阅读
图像质量评价是指通过对图像进行相关特性分析,量化视觉失真程度,得到其质量分数的过程。无参考图像质量评价旨在不提供原始图像信息的情况下,对失真图像进行质量评价,其更接近于实际应用并且更具挑战性。通过无参考图像质量评价,可以更好地监控图像质量并进一步引导各种图像处理系统的优化。自然图像和屏幕内容图像是图像质量评价领域的重点研究对象,故本文主要围绕这两类图像来设计合适的无参考质量评估算法。由于目前基于卷积神经网络(Convolutional Neural Networks,CNN)的无参考自然图像质量评价方法主要通过对图像进行分块预处理以实现数据增强,忽略了失真分布不稳定带来的误差。为此,本文提出一种基于伪孪生CNN的训练方法,引导其对失真图像进行配对来扩大训练数据量,从而避免了分块预处理引入的额外误差。该方法首先利用K-means聚类将失真图像质量分数分为5簇,其代表不同的失真等级。再利用伪孪生神经网络训练学习该5个失真等级间的失真距离分布,旨在缩小同一失真等级内的失真距离,增大不同失真等级间的失真距离。最后,通过添加新的融合层对所学到的质量分数进行求和平均,并在原数据集上对其进行微调,从而得到各失真图像的质量评估结果。实验结果表明本文方法能够在不分块预处理的情况下更精确地评估失真图像质量,相比其它算法,更有效精准地评估了目前公认数据集的质量情况。另外,考虑到屏幕内容图像和自然图像在视觉特征上具有显著差异,因此自然图像质量评价方法并不能直接作用于屏幕内容图像质量评价。为此,本文提出了一种专门针对屏幕图像多纹理特性的无参考质量评价方法,通过在网络架构的设计上引入方向梯度直方图(Histogram of Oriented Gradient,HOG)特征预测任务和质量评估任务,以多任务训练的方式加强网络对屏幕内容图像纹理特征的学习,从而更有针对性地贴合屏幕内容图像的主观质量评估结果。此外,还引入了基于屏幕图像内容的自适应权重估计的质量融合策略,通过对不同区域的图像块质量分数进行加权平均,进一步提高了无参考屏幕内容图像质量评价方法的准确性。实验结果表明本文方法能有效评估目前现有的两大屏幕内容图像数据集质量,且相比其它算法,具有较高的准确度和较强的泛化能力。
其他文献
为优化能源结构,新能源开发与利用迫在眉睫。但大部分可再生能源存在间歇性、易受外界干扰的缺陷,分布式发电系统稳压控制成为研究热点。利用不同能源的互补性,构建多输入源联合发电系统,可在单输入源稳压的基础上获得更稳定的输出电压。由于三输入源绕组开放式电机发电系统集成度高,本文致力于研究该系统稳压、功率分配控制策略及动态性能优化。首先基于并联式三输入源绕组开路式永磁电机发电系统,介绍了三输入源联合发电系统
碳酸锂作为一种心境稳定剂,是治疗双相障碍(BD)的一线药物。由于其治疗窗窄、个体差异大,疗效易受患者生理病理状态及药物相互作用的影响,且随着治疗药物监测(TDM)、群体药动学(PPK)及药物基因组学在碳酸锂个体化用药中辅助作用的日益凸显,如何更有效地优化碳酸锂的个体化用药备受关注。本文综述了近年来碳酸锂个体化治疗中TDM、PPK和药物基因组学的相关研究进展。由于受到患者病理生理状态的影响,不同人群
蓄电池组是微电网储能系统重要的组成部分之一,对储能系统的整体技术及经济性能具有重要影响。针对蓄电池荷电状态(SOC)与健康状态(SOH)在线准确测量的难题,提出基于长短期记忆(LSTM)神经网络的蓄电池SOC与SOH联合在线估算方法。该方法利用LSTM的动态逼近与长时间记忆能力,以电池端电压、电流及温度的时间序列数据,将阶段SOH均值引入SOC的估算中实现联合估算。采用NASA开放实验数据测试,基
机载投掷式射频有源诱饵弹是对抗单脉冲主动末制导雷达寻的跟踪的有效手段之一,介绍了机载投掷式射频有源诱饵弹的外军研究情况、主要战术性能要求以及关键技术。并对涉及的关键技术进行了分析和仿真,给出了工程设计可行的结论。
近些年来,文化创意产业发展迅速,其带来的经济效益不断增加。文章以创意产业发展为研究对象,调查了德国汉堡市文化创意产业的发展现状。通过对其现状进行深刻剖析,明确文化创意产业的经济增长进程,了解该行业在德国汉堡市的产业规模,以及德国对于该行业的相关鼓励政策,阐明文化创意产业对于经济发展的意义及作用,继而探析创意产业的发展潜力,表明文化创意产业发展的重要性。为决策者制定文化创意产业发展计划提供参考,从而
城市工业化进程速度的提升改善了人们的生活质量,但是也给我们生活的环境带来了很多压力。频繁的雾霾天气给人们的生活带来了很大的影响,同时图像处理以及计算机视觉技术在智慧交通、军事安全、视频监控等领域的应用范围也逐渐扩大。因此如何利用图像去雾技术提高图片的清晰度,恢复图像细节成为近年来学术研究的热点问题。在雾霾条件下,物体表面反射的光线与空气中遇到的细颗粒物互相碰撞导致最终拍摄的图片质量下降,使得在室外
能够从他人的面部表情或者言语表达中准确感知所要表达的情感对于成功的社会交互非常关键。先前关于情感认知的研究大多是单模态的,与多模态情感语音感知相关的研究相对匮乏,研究结果也不具有一致性。关于多模态情感信息整合的研究由来已久,使用不同的脑活动测量方法确定了涉及情感信息视听整合的脑区位置,主要集中在双侧颞上区。然而,研究中采用的方法相对单一,并且研究内容很少包含语音信息。因此,在多模态刺激条件下,不同
随着通信技术的不断发展,移动流量暴涨的同时用户对网络服务的需求也变得更复杂,然而仅靠升级网络基础设施不仅需要较长的时间,还严重提高了运营成本,同时在移动网络内存在着严重的流行内容重复下载问题。因此,有必要基于“设备-设备”(Device-to-Device,D2D)通信技术将用户在线上的下载需求转为通过线下设备间的直接分享实现。此外,在用户使用D2D分享时还会形成移动社交网络,我们还可以挖掘其中具
脑部肿瘤是一种颅内局灶性症状疾病,脑肿瘤分类更是计算机视觉在医学领域中的一项应用研究。当前,基于深度学习的神经网络模型对脑部核磁共振图像进行图像分析并区分患者的肿瘤类别,在临床医学领域具有良好的应用前景。然而不同于自然图像,核磁共振图像有背景复杂和像素值低的特殊性,使得在脑肿瘤分类任务中肿瘤边界模糊和肿瘤标签有效性过低,肿瘤大小和位置不清晰,导致神经网络模型不能精确地对目标区域进行特征提取。针对上
在真实社会中,许多数据可以表现成网络的形式。例如:社交网络中人与人之间的关系可以表现为网络的形式,电商中用户和商品的行为关系可以表现为商品网络的形式。随着现代互联网的发展,海量的数据在互联网中产生,通过这些数据的内在联系将他们构建成网络数据可以充分的挖掘出其中包含的知识。在工业场景这些网络数据的具体应用场景包括:风控场景下的用户分类、电商场景中的用户对商品的购买点击的行为预测等。深度生成模型是表征