论文部分内容阅读
随着计算机处理能力的增强和视频采集设备的普及,机器视觉在人机交瓦中表现出良好的应用前景。通过对人体姿态,动作,面部表情等的捕捉和分析,可以在最自然的状态下获得大量的人机交瓦信息。针对视觉交互的实时性要求,本文提出了一个基于背景建模的人体跟踪方案,能够实时的为每帧图像给出人体窗口和较为完整的人体轮廓,其主要贡献如下:
第一,对现有的典型背景建模方法,包括像素级的参数化背景模型、非参数化背景模型和图像级背景模型进行了实验对比,并对现有背景建模方法的优缺点及其固有难点进行了分析,为基于背景建模的人体跟踪技术研究奠定了基础。
第二,对基于Meanshift向量的跟踪进行了改进,提出了一种基于起始帧背景建模的人体跟踪方案。Meanshift向量的迭代计算是一种在避免求底层分布密度函数的前提下,搜寻分布密度局部极值的算法,但其有效性依赖于Meanshift向量的采样点密度定义和初始化。由于像素在图像中分布均匀,无法为Meanshift向量的计算提供有效的采样点密度梯度。为此,为每个像素引入额外的像素权重,并基于背景建模技术对人体的跟踪进行初始化:一方面通过对前景、背景像素的判别,检测人体区域的轮廓,找出人体跟踪的初始窗口:另一方面,根据人体区域轮廓内的像素值样本初始化象素值概率分布P,用于初始化Meanshitt向量定义所用的的像素权重函数。实验证明背景建模技术能够满足人体跟踪的初始化要求,使Meanshift向量的迭代计算对每帧新图像迅速收敛,满足跟踪人体和人脸的实时性要求。
第三,基于对背景建模技术的改进,提出了一种基于逐帧图像背景建模的人体跟踪算法。为了避免过于依赖开始人体跟踪时第一帧图像的前景、背景像素判别的准确性,利用背景建模的鲁棒性和能够利用逐帧视频图像进行更新的能力,本文尝试直接基于逐帧图像中前景像素的分布定义Meanshift向量的采样点密度,而这对背景建模技术提出了更高的要求。为此,本文对现有背景建模方法进行了改进。一方面,通过对背景模型形式的改进,兼顾了实时性的要求和对前景、背景像素的判别准确性。另一方面,改进了现有背景建模方法的背景模型更新策略,使其既能根据背景中发生的变化对背景模型进行及时、准确的更新,又能有效避免背景模型的更新过程受到前景物体的影响。在改进背景建模方法的基础上,本文给出了一种基于逐帧图像背景建模的人体跟踪方案。该方案基于前景像素在图像中的分布对每一帧新图像迭代计算人体窗口的Meanshift向量,并根据Meanshift向量完成人体窗口在新一帧图像中的定位。新的人体窗口则用来指导背景建模方法对背景模型进行更新。人体窗口的限定保证了背景模型更新的准确性,并进一步保障了背景模型对下一帧图像给出的前景、背景像素判别的准确性,而前景、背景像素判别的准确性则反过来保证了基于Meanshift向量对人体窗口进行定位的准确性。