论文部分内容阅读
基于视频流的目标检测、跟踪与识别是计算机视觉和模式识别领域的热点问题,在智能视频监控、高级人机交互、移动机器人定位与导航、虚拟现实等领域具有广泛的应用前景。经过几十年学者们的不懈努力,上述技术已经有了较多的研究成果。由于视觉应用系统中环境的复杂性以及目标本身的多样性,给目标检测、跟踪和识别技术带来了极大的困难。实践表明一般意义上的目标检测、跟踪与识别技术还远未成熟,距离实用化尚存在一定差距,还需要开发出更为实用鲁棒的算法。本论文从理论和实际应用的角度出发,对以视频为输入的运动目标识别的相关关键技术进行研究,研究内容主要涉及运动目标的检测、运动目标的跟踪、运动特征的表征和识别方法等。本文研究了背景建模方法,提出了一种基于像素统计分类的视频流目标检测算法,借助把图像的像素值看成是前景高斯分布和背景高斯分布的组合,进行背景估计和自适应背景更新;以统计当前帧前景像素的点数来判定光照突变,并结合帧间差分法来检测运动目标。仿真实验表明,该算法可以实时准确地检测出前景运动目标,具有更强的适应性。通过复杂背景下的人脸检测实验表明,该算法在基于肤色信息的人脸检测中也具有一定的实际应用价值。本文还提出了一种基于链码标定的圆检测算法,利用数学形态学方法有效地去噪填充和提取二值图像的边缘,再利用链码方法确定圆度参数。实验表明,该算法简单有效,计算精度小于1个像素,具有较好的实用效果。针对多目标跟踪问题,本文提出了融合角点特征的多目标跟踪算法。利用改进的Harris算子提取运动目标的均匀稳定的特征点,通过特征匹配和匹配优化,完成视频运动多目标的跟踪。跟踪实验表明,该算法能够完成视角变化、旋转、仿射变换、光照变化等多种情况下的稳定匹配,可以实现小部分遮挡状态下目标的稳定跟踪。本文研究了经典的Mean shift跟踪算法,由于该算法对于快速运动的目标跟踪是无效的,而且还存在误差累积的问题,因此本文提出了基于质心加权的Kalman滤波的跟踪算法。利用背景差锁定动态目标跟踪区域,在目标跟踪开始时利用Kalman滤波来预测目标的位置,然后采用质心加权算法优化修正跟踪目标的位置,并以修正后的状态预测值进行观测更新,进而实现对跟踪目标较为精确的定位。经过仿真实验分析,该算法在有效检测到运动物体的同时能够快速准确地跟踪运动物体,具有较好的实时性与较强的鲁棒性。针对复杂多变光照下的人脸识别问题,本文提出了基于LBP算子与EMD的人脸识别算法,首先对图像进行一系列简单有效的预处理以提高算法的鲁棒性,然后提取图像的局部LBP特征,获得图像的LBP直方图。采用EMD方法对LBP直方图进行计算,完成对图像相似性的度量。在GTAV标准人脸库上实验结果表明,该算法显著提高了识别率。人体行为识别与理解属于更高一层的视觉任务。本文在探讨了各种人体行为识别算法的基础上,提出了一种基于时空兴趣点的人体行为识别算法,采用3D Harris角点提取不同行为的时空特征,然后采用K-means聚类和LLE结合的方法对提取的运动特征进行降维和分类,训练识别过程则采用平均Hausdorff距离的几何特征方法完成相似性配准。KTH数据库上的实验表明该算法是有效可行的,基于流的轨迹识别方法进一步提高了识别的准确率。