论文部分内容阅读
运动目标跟踪和动作识别是计算机视觉和模式识别领域的热点问题。目标跟踪过程中,由于存在视角变化、姿态变化、尺度变化、光照变化以及遮挡问题等,使得长时间鲁棒跟踪目标变得困难;而动作识别过程中,不仅存在外界环境变化的因素,还有同类动作不存在统一格式、动作在时间维度上难以分割等困难,使得动作识别同样成为一个具有挑战性的课题。本文在国内外当前研究的基础上,利用“词袋”模型等相关理论来解决目标跟踪和动作识别两类问题,分别提出在线特征稠密采样的目标跟踪算法和基于时空特征的动作识别算法。第一,本文提出了基于在线特征稠密特征采样并结合BOW模型与粒子滤波的算法来处理目标跟踪问题,首先对目标区域及其领域进行稠密采样并进行特征描述,得到包含正负样本的特征向量集合。其次采用聚类算法构建视觉词典来建立有判别力的目标外观模型。在跟踪过程中,对候选区域同样进行稠密采样并用学习得到的视觉词典进行外观表示。然后计算每个候选区域与目标区域的似然值并排序。最后在贝叶斯框架下使用最大后验概率方法实现对目标的准确跟踪,并对视觉词典以及目标外观模板进行更新。实验结果表明,本文算法与当前主流跟踪算法比较,能够有效处理目标快速运动、外观变化、背景混淆、部分遮挡而导致跟踪性能下降甚至跟踪目标丢失的问题,同时在海上红外图像序列上,本文算法也具有较好的鲁棒性。第二,本文提出了一种基于时空特征改进并结合BOW模型的动作识别算法。首先对输入视频样本进行关键点检测并在其领域空间建立多个三维立方体,增加关键点的时空特性,其次对关键点集合进行随机采样并用梯度方向直方图和光流直方图进行描述,得到复合特征描述子。然后采用聚类算法构建视觉词典并对输入视频样本进行表示。最后利用多核SVM方法训练生成分类器,完成动作识别。实验结果表明,本文算法相对于当前大多数动作识别算法,具有更优的识别率和鲁棒性。