论文部分内容阅读
视频处理过程中,视频压缩过程和各种噪声的引入会使视频产生失真。有效评价视频质量对于视频处理应用领域有着重要影响。人眼是视频的最终观看者,视频质量评价的关键在于构建模型的结果能够与人类主观感受一致。因此,基于人眼的视觉特性构建视频质量评价模型是目前最理想的评价途径。本文基于人眼视觉特性构建视频质量评价模型。首先,本文重点分析视频质量感知评价的两个重要因素,人眼视觉特性的时域掩蔽效应和时域失真波动。在已有视频质量评价研究中,很少考虑到时域失真波动对视频主观感知质量的影响。本文基于时域失真的改进如下:(1)运动是视频的重要特征,它体现了视频的时域特性。该部分通过分析视频中物体运动对视频失真的影响,同时根据运动特性衡量相邻帧的失真特性,建立与视频运动特性相关的时域绝对失真评估方法。(2)根据视频时域管道上绝对失真的波动情况,度量时域失真的感知程度。(3)中心凹特性和视觉暂留效应对时域失真评价模型具有调制作用。通过分析人眼视觉特性,调节视频时域失真使其与人眼感知结果一致性较好。其次,视频质量评价不仅仅包括时域感知失真,为了进一步构建视频感知质量评价算法,本文考虑加入了人眼注意力机制。其中主要包括失真区域显著性和运动区域显著性。(1)观察者对于视频场景中不同区域有不同的视觉兴趣程度。失真区域是视频播放过程中人眼关注的焦点。时域感知失真和时域失真波动是衡量视频时域失真的重要因素。通过定量度量视频序列的时域感知失真和时域失真波动,并根据这两个参量,采用自适应阈值的判断方法,标定出可能存在的失真像素点。对选中的可能区域点,进行连通分析。最终根据聚类算法,确定最终的失真显著性区域。(2)运动区域是人眼视觉注意的区域。通过研究频谱特性,发现视频帧的幅值信息和相位信息对于检测运动区域具有重要作用。基于视频邻近帧的频谱特性分析,将视频测试帧及其邻近帧的频谱差特性融合到视频运动区域检测中,最终根据目标物检测算法得出运动显著性区域。最终,算法融合了时域感知失真、失真区域显著性和运动区域显著性。根据失真区域显著性和运动区域显著性调整时域失真,建立视频感知质量评价模型。算法在LIVE数据库上进行测试,结果验证了客观分数与主观评测分数具有良好的一致性,验证了本文提出算法的可行性。