论文部分内容阅读
合成视频指由多个视频源拼接而成的视频,现在已经广泛的应用于多种多样的互联网应用中,例如多人在线视频,网络视频会议等等。在此类视频中,通常存在一个或多个视频源,包含了用户较为感兴趣的区域,例如网络视频会议中的发言者,这类视频源将被认定为ROI (Region of interest),而其他视频源则被称为非ROI。显然,当带宽有限的情况下,用户感兴趣的视频源的质量应该得到优先保证,同时,ROI区域的质量应该保持稳定性,不应有大幅度的波动。基于上述需求,本文提出一种针对合成视频的码率控制方法,在本文的方法中,每个视频源将会有独立的率失真模型(Rate-Distortion Model, R-D model),以精确的估计每个源的编码消耗。为了提高ROI区域的画质, ROI视频源将被分配较低的量化参数(Quantization parameter, QP),而非ROI区域则会被分配较高的量化参数。为了兼顾ROI区域的质量稳定性,我们建立了一种结合了质量与稳定性的目标函数,通过最小化目标函数的值,来优化的求解ROI与非ROI区域的量化参数。本方法是在JM15.1上实现的,并且通过与JM15.1的编码效果对比,证明了该方法对于提高合成视频中ROI的质量与稳定性,有着良好的效果。