论文部分内容阅读
可伸缩视频编码(SVC,Scalable Video Coding)标准作为H.264/AVC的扩展部分,能同时在异构的网络中为不同的终端设备提供高质量的视频服务,具有广泛的研究和应用领域。如果不考虑视频内容这一重要因素,将不能最大限度的提高视频的编码效率和用户对视频质量的满意程度。本文从视频内容的角度出发,对SVC进行研究,提出了等效均方误差(Eq-MSE,Equivalent Mean Square Error,也称为等效MSE)方法并定义了最小不抖动帧率(MinFR,Minimal Frame Rate Without Jitter)参数;为降低计算复杂度,简化了关于时间和质量可伸缩性的联合传输速率模型;以帧组尺寸(GOPsize,Group of Pictures size)为研究对象,分析了GOPsize对传输速率和编码时间的影响,分别提出了传输速率关于GOPsize的模型和编码时间关于GOPsize的模型,并通过二者的联合模型,计算使编码效率和编码时间达到最优折中的GOPsize。应用所提出的方法和模型,能够有效地提高SVC的性能及用户的满意度。具体来说,本文主要完成了以下工作:(1)提出用于计算二维非正弦图像空间频率的等效MSE方法。通过计算视频序列中相邻帧之间的MSE值,将计算结果与单位空间频率的图像在相同运动条件下所引起的MSE的比值,作为二维非正弦图像信号的空间频率。使用该方法能够准确的计算二维非正弦图像信号的空间频率,为进一步计算由于视频中物体的运动所引起的时间频率奠定基础。还通过详细分析物体的空间频率及运动与人眼对视频感知的关系,得出结论:在物体运动速度恒定的条件下,当其运动方向与空间频率的方向一致时,所引起的时间频率最大;当其运动方向与空间频率的方向正交时,所引起的时间频率为0,即无论物体的运动速度有多快,人眼都不会感觉到它在运动。(2)定义了人眼所能接受视频播放的最小帧率——MinFR参数及其计算方法。当视频的播放帧率小于MinFR时,人眼会感到物体的运动是抖动的;而当帧率大于MinFR时,人眼就会感到物体的运动是连续的。MinFR是通过视频序列的时间频率得到的,为降低计算复杂度,本文还进一步提出了视频序列时间频率的简化计算方法。应用这一方法,能够准确计算满足人眼感觉的最小帧率。MinFR的提出在实际中有着重要的应用价值,在带宽受限的条件下,为提取具有最优解码质量的码流奠定了基础。(3)提出关于时间和质量联合可伸缩性的子流传输速率模型的简化计算方法。对于不同的视频序列,模型的时间可伸缩性参数由时间频率的值通过查表的方法得到,可以降低计算的复杂度。并通过主观感知质量对不同视频序列的MinFR进行验证。在带宽一定的条件下,应用简化后的子流传输速率模型,比较不同子流的解码质量,实验结果表明,在带宽受限的条件下,帧率为MinFR的子流,能够获得最优主观感知解码质量。(4)分别提出码流速率关于GOPsize的模型和编码时间关于GOPsize的模型,能够准确的描述码流速率和编码时间随GOPsize变化的情况。又提出了码流速率和编码时间关于GOPsize的联合模型,应用此模型可以准确计算使不同视频序列的传输速率和编码时间达到最优折中的GOPsize。还在联合模型的基础上,进一步提出调整模型参数的方法,以适应具有不同编码要求的系统。最后,在码流速率和编码时间参数相等或接近的条件下,通过实验验证了联合模型的有效性和可靠性。