基于视频时空特征稀疏编码表示的人体行为识别

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hughy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的人体行为识别主要是指对包含人体行为的视频文件或片段进行分类和标记,是近年来计算机视觉和模式识别领域一个非常热门的研究方向,在人机交互、智能监控、视频检索等领域有广泛的应用。在视频中的人体行为识别相关工作中,基于视频的局部时空特征的方法被深入地研究。而在图像特征编码领域,稀疏编码是一种被普遍应用的方法。本文针对基于视频时空特征和稀疏编码结合的视频表示在人体行为识别问题中的应用进行了研究。本文的主要研究工作和创新点如下:1.首先对视频时空兴趣点的检测算法和特征提取算法进行了回顾和比较,分析了各算法的优缺点、适合的应用场景,比较了各算法的性能表现。本文还对稀疏编码的原理和主要算法进行了介绍,并对各算法的特点和优劣进行了详细的探讨。2.针对目前一些基于时空特征的视频表示存在的对于目标行为多次重复的视频特征分布进行不恰当整体编码的问题,提出了一种基于视频时空特征聚类的视频子片段检测的方法,并结合聚类分析的方法自动地选择合适的视频子片段个数,从而使每个视频子片段包含目标行为的一次出现。3.提出了一种基于时空金字塔的匹配和最大汇总结合的方法来生成分割后的视频子片段的表示,并进一步将子片段的表示进行最大汇总生成视频表示。4.最后,用实验结果验证了上述视频表示框架的有效性,并对参数的选择、实验的设置和实验的结果进行了详细的展示。
其他文献
随着大数据时代的到来,如何高效地分析处理海量数据成为了计算机学科的一个新的挑战。MapReduce就是在此背景下出现并飞速发展的一种计算模型。在此之前,并非没有并行计算模型,
关联规则问题是数据挖掘领域的一个研究热点。该问题的解决分为两步:频繁项集挖掘和利用这些频繁项集产生强关联规则。由于第一步决定着整体性能,因此研究频繁项集挖掘问题具有
并行/分布式数据挖掘是针对当前信息量日益增大以及数据所呈现的高维、异构和分布式存储等特性而出现的新的研究课题,分类规则挖掘是数据挖掘领域的重要分支。本文着重对多数
本文主要针对数字音频水印的稳健性、理论模型及抗几何变换攻击等问题展开研究,针对现有一些数字音频水印算法中的同步问题缺陷,提出了一种基于离散小波变换DWT(DiscreteWavele
时态数据预测是时态数据挖掘的一个重要的研究方向。它是用被预测事物过去或现在的已知数据,构造依时间变化的挖掘模型,对将来的未知做出预测。支持向量机是九十年代中期提出来
本文主要对视觉坐标测量机的仿真模型进行研究,以摄像机为测头,进行非接触式立体视觉测量。该模型通过对摄像机的运动控制,形成多目立体视觉模型,实现了基于多目的非接触仿真
入侵事件的日益猖獗,人们发现只从防御的角度构造安全系统是不够的。入侵检测系统IDS是继防火墙、数据加密等传统安全保护措施后新一代的安全保障技术。它对计算机和网络资源
JXTA技术是网络编程和计算的平台,是用以解决现代分布计算尤其是点对点(P2P)计算中出现的问题的一种技术规范。JXTA技术提供了基础性的机制解决当前分布计算应用中面临的问题
随着人们对软件系统的要求不断地提高,形式化技术得到了充分的发展。过去人们依赖于优秀的软件工程师来对软件系统可靠性和安全性提供保证,而如今,人们可以使用已有的形式化技术
随着社会和科技的发展,离散事件动态系统(DEDS)的性能分析和优化应用已经成为控制与系统、管理、计算机等学科交叉领域内的一个前沿研究方向。半马尔可夫决策过程(SMDP)作为