论文部分内容阅读
视频对象分割在时域和空域运用视频分析技术把视频分为多个视频对象,是基于内容的交互式视频处理系统(如视频编码、索引、描述、检索等系统)的关键前处理技术,也是MPEG-4与MPEG-7的重要组成部分。在交互式多媒体成为研究热点的同时,在网络流媒体、无线视频传输、视频点播及视频电话等应用中,对更高编码效率的需求依然迫切。回顾视频编码标准的发展可见,运动估计/运动补偿技术的改进仍然是提高编码效率的主要因素。因此,本论文深入研究了视频对象分割技术和先进的运动估计/运动补偿算法。 自动高效精确的视频对象分割是基于内容的视频编码的一项关键技术。针对头肩视频序列,本文提出了一种头肩视频对象的自动精确提取算法。该算法首先运用改进的背景记录技术建立起可靠的背景图像,结合背景差和帧差检测出运动物体区域;然后,通过新的时域滤波器和后处理以增强检测结果的时域连贯性和空域完整性;最后,提出一种改进的分水岭算法精确定位视频对象边缘。实验表明,该算法能有效地提取出头肩视频对象,获得精确的边缘,且能达到每秒11帧(QCIF)的处理速度,算法实时性较好。 在低码率视频监控应用中,运动物体区域(感兴趣区域,ROI)的图像质量往往较差。针对此问题,本文设计了一种运动物体区域图像质量优先的视频编码方案;采用快速有效的运动物体自动分割算法动态定义ROI;为增强ROI图像质量,设计了图像质量和码率联合控制机制编码ROI。在H.263+编码平台上的实验测试表明,采用所提的编码方案,ROI区域的PSNR可以提高1dB,并可显著地增强ROI的主观图像质量,非常适于低码率实时视频监控应用。 与以往标准相比,最新的H.264/AVC视频编码标准的编码效率可以提高1.5~2倍,而编码器的实现复杂度也增加了一个数量级。为了降低H.264/AVC编码器的计算复杂度,本文提出了两种基于局部运动活性估计的快速模式选择算法。基于帧差和位移帧差分析的方法,充分利用运动物体颜色的空域一致性、运动活性信息及最佳参考帧选择的统计特征,有效地预测并省略不必要测试的编码模式和参考帧。实验结果表明,采用此方法可以降低40~80%的编码时间,而编码效率损失极小。此外,为使H.264编码器具有对图像质量和可利用计算能力(或功耗)的折衷功能,本文提出了一种计算复杂度可调的快速模式选择算法。该算法依据编码模式的特点和最佳模式分布规律,利用运动活性及已测试模式所得残差的量化系数来预测尚未测试模式的编码性能,略过不必要测试