论文部分内容阅读
随着多媒体应用的爆炸式增长,对于视频质量如何更加准确评价的问题越来越多地受到了研究人员的关注。为了从视频信息中提取出更加准确地反映人眼主观感受的视频质量信息,本文利用人类视觉系统(HVS:Human Visual System)特性,基于视觉感知概念进行了视频质量评价(VQA:Video Quality Assessment)方法的研究。本文将视频质量评价流程拆分为空间域的单帧图像质量评价(IQA:Image Quality Assessment)与时间域的质量汇聚两个阶段。在空间域质量评价阶段使用已有的IQA模型进行帧级别分数的计算,并将视频序列各帧质量分数通过时间汇聚策略整合为单一质量分数。基于以上评价流程,本文的研究目标是将现有IQA模型扩展为VQA模型。为此,本文分别提出了空间域与时间域的VQA模型。在空间域VQA模型中,本文对利用IQA模型计算出的质量图信息,结合视觉注意模型以及光流法,将人眼注视位置与视频序列中的运动信息加以考虑,提供了更加符合HVS特性的权重分配。考虑到视觉注意模型计算的显著图在VQA任务下的局限性,本文提出失真均匀度概念,用于强调视频失真信息对显著图结果的贡献。为改进IQA模型普遍使用的未考虑HVS特性的平均汇聚策略,本文在平衡全局质量以及局部质量的思想下,结合百分位数汇聚和失真均匀度指标提出一种自适应空间汇聚策略。在时间域VQA模型的研究中,考虑到IQA模型扩展为VQA模型时通常会直接将IQA模型的单帧质量分数通过平均汇聚策略整合为视频质量分数,并未考虑HVS特性,本文基于视觉感知概念对视觉心理效应进行建模,提出一种记忆效应模型,并通过该模型对帧级别质量分数序列进行处理,得到更加符合HVS特性的帧级别质量分数。接着,将失真均匀度概念扩展到时间域,结合基于百分位数汇聚的时间汇聚策略,将帧级别质量分数整合为客观视频质量分数。本文对提出的模型与已有IQA模型进行组合,与目前具有代表性的若干种IQA与VQA模型一起,在两种公开的视频数据库中进行了性能评估实验,并给出了实验结果分析以及统计显著性分析。实验结果表明,在参与实验的模型中,本文提出的模型取得了最优的预测性能表现,并在统计学意义的性能上优于或等价于先今具有代表性的两种VQA模型。