基于词袋模型的目标跟踪和动作识别算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:laotzu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运动目标跟踪和动作识别是计算机视觉和模式识别领域的热点问题。目标跟踪过程中,由于存在视角变化、姿态变化、尺度变化、光照变化以及遮挡问题等,使得长时间鲁棒跟踪目标变得困难;而动作识别过程中,不仅存在外界环境变化的因素,还有同类动作不存在统一格式、动作在时间维度上难以分割等困难,使得动作识别同样成为一个具有挑战性的课题。本文在国内外当前研究的基础上,利用“词袋”模型等相关理论来解决目标跟踪和动作识别两类问题,分别提出在线特征稠密采样的目标跟踪算法和基于时空特征的动作识别算法。第一,本文提出了基于在线特征稠密特征采样并结合BOW模型与粒子滤波的算法来处理目标跟踪问题,首先对目标区域及其领域进行稠密采样并进行特征描述,得到包含正负样本的特征向量集合。其次采用聚类算法构建视觉词典来建立有判别力的目标外观模型。在跟踪过程中,对候选区域同样进行稠密采样并用学习得到的视觉词典进行外观表示。然后计算每个候选区域与目标区域的似然值并排序。最后在贝叶斯框架下使用最大后验概率方法实现对目标的准确跟踪,并对视觉词典以及目标外观模板进行更新。实验结果表明,本文算法与当前主流跟踪算法比较,能够有效处理目标快速运动、外观变化、背景混淆、部分遮挡而导致跟踪性能下降甚至跟踪目标丢失的问题,同时在海上红外图像序列上,本文算法也具有较好的鲁棒性。第二,本文提出了一种基于时空特征改进并结合BOW模型的动作识别算法。首先对输入视频样本进行关键点检测并在其领域空间建立多个三维立方体,增加关键点的时空特性,其次对关键点集合进行随机采样并用梯度方向直方图和光流直方图进行描述,得到复合特征描述子。然后采用聚类算法构建视觉词典并对输入视频样本进行表示。最后利用多核SVM方法训练生成分类器,完成动作识别。实验结果表明,本文算法相对于当前大多数动作识别算法,具有更优的识别率和鲁棒性。
其他文献
现如今,全球经济迅猛发展,资源的过度开采、破坏环境使得我们在创造丰富的物质财富的同时,也对环境造成了不可磨灭的负面影响,世界范围内的环境问题频发。我国用了短短三十年
利用X射线微层析成像技术获得了单向温模压TATB基高聚物粘结炸药微细结构的全三维信息。松装颗粒经升温软化、压制、摩擦仍完整并以不同形态保存下来。压制后的颗粒典型形态
对湖南制造业发展质量与国际竞争力互动发展关系进行了理论探讨,构建了互动评价指标体系.采用耦合模型,结合2010-2016年的数据,对湖南制造业发展质量与国际竞争力这两者的综
当前我国社会经济发展迅速,在这种时代发展趋势下,每一个企业单位都想法设法来实现经济效益的最大化。当然,这种想法在化工企业中也不例外。化工企业负责人通过对生产成本的
<正>每年我都要承担家长开放日的授课任务,以往我总会反复斟酌、精心准备。每次课后都能听到家长夸赞的声音,可我总感到缺一点儿什么。今年我又要上开放日的体育课了,我在备
<正>"写记叙性文章,表达意图明确,内容具体充实",这是《义务教育语文课程标准》(2011年版)对"写作"的要求之一。但是,目前有些学生在写作中缺乏的就是具体充实的内容。笔者对
<正>孙犁先生的小说《荷花淀》,恰似一幅散发着浓郁水乡气息的写意画,描摹了白洋淀人民在抗日战争中保家卫国的献身精神以及识大体、明大义的朴素情怀。说它是画,因为小说在
<正>从2011年至今,辽宁省在学校体育工作方面的两项重要举措在全国学校体育界引起了广泛的关注,一是省教育厅和财政厅联合发文《关于调整学校体育教师工作待遇和业余体育训练
自动配准是处理遥感多图象数据的重要技术。为了克服现有算法在实际应用中的不足 ,提出了一种新的实用配准方法 ,这种方法简单有效 ,提取出的控制点数量足够且分布均匀 ,并通