基于多慢特征融合的人体行为识别研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:miaoloveyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机及网络技术的迅猛发展,多媒体信息已经渗透到人们生产生活的各个方面,并且在近年来呈现出信息交互频繁、数据海量增长、云端服务日益完善的发展特点。视频作为载有文字、图像、音频等信息的文件形式,在海量数据中占有重要的地位。在大数据时代的背景下,面对大量视频数据的智能分析需求,计算机视频领域的相关研究和应用显得更加突出。作为计算机视频领域的重要一部分,人体行为识别在视频监控、视频内容分析和人机交互等方面具有广泛的应用前景。人体行为识别关键在于特征的提取,因此提取的特征也是影响识别结果的决定性因素之一。针对特征的提取,近三十年来国内外的高校、科研机构对人体行为识别进行了广泛深入地研究,取得了丰硕的学术成果,推动了人体行为识别研究向更高更深的层次发展。本文研究的是基于多慢特征融合的人体行为识别方法,首先提取多种局部特征,对其进行慢特征分析,计算形成相应的慢特征,然后采用底层特征组合和高层特征融合的方法,对单人行为和多人行为进行识别。论文介绍了多慢特征融合方法所涉及到的基本理论和方法,重点分析慢特征分析学习策略和融合方法的特点,在此基础上提出了基于多慢特征融合的人体行为识别方法。本文的主要研究内容包括多慢特征分析和多慢特征融合两个阶段。在多慢特征分析阶段,首先提取梯度方向直方图、光流直方图和尺度不变特征转换直方图三种特征,然后采用带监督的慢特征分析方法学习每种特征的慢特征函数,之后根据学习得到的慢特征函数,选择累积导数平方的形式计算得到上述每种特征对应的慢特征,从而表达视频中变化缓慢的时空信息,最终形成多慢特征。在多慢特征融合阶段,本文分别采用底层特征组合和高层特征融合的方法对多个慢特征进行融合。对于底层特征组合,本文直接将上述三种慢特征向量级联形成组合特征向量,然后送入支持向量进行分类;对于高层特征融合,本文将上述三种慢特征分为训练样本和测试样本,对该样本训练得到不同慢特征的交叉验证精度参数,将其作为高层特征融合的权值,然后对每种慢特征分别采用支持向量机对人体行为进行分类,得到各自的分类结果,将每种特征的分类结果进行加权计算,最终确定高层特征融合后的分类结果。在实验部分,本文分别在Weizmann库、KTH库、UT-Interaction库和CISAC库上对提出的算法进行验证,实验结果表明本文提出的多慢特征融合方法对单人和多人行为能够获得较好的识别效果,在视频分析和安全预警方面也有潜在的应用价值。
其他文献
Internet作为上世纪70年代的产物,其主要是以面向文本数据传输为背景提出来的,随着多媒体网络应用变得丰富,Internet传统的“尽其所能”的服务模式已经难以满足新数据流对服
人脸识别和虹膜识别作为两种最常用和方便的生物特征识别技术,已广泛应用于身份识别等领域。然而很多时候,仅仅基于虹膜或人脸的个人身份自动识别系统不能满足人们的需要,这是因
油藏数值模拟始于20世纪50年代,是随油藏工程渗流理论、计算数学理论电子、计算机技术的发展而形成的一门新兴学科。油藏数值模拟通过分析油藏内的流体状况,预测油藏的未来动
这些年来,由于国内经济的飞速发展,汽车的数量越来越多,而道路容量不能满足现在的需求,交通事故和交通堵塞时时刻刻在发生,城市的交通压力越来越大。在这种形势下,由于无法避
虚拟驾驶系统是数字媒体领域的热点应用之一,它覆盖了计算机图形学、3D渲染、物理仿真等多个领域的方法和技术,在数字娱乐、交通仿真、汽车工业研发、国防建设等领域有着广泛的
随着计算机技术特别是Internet技术的迅猛发展,各个行业、单位、机构或部门内部都逐步实现了业务、信息的计算机管理。在企业内部,由于部门间相对独立,构建系统时缺乏统一的规划
随着计算机技术的发展,动画在电影、游戏中所占比重越来越高,因此合理的动画生成算法既要满足一定的质量要求,而且需要满足一定的速度要求。在质量和速度的平衡中找到新的算
随着信息技术的飞速发展以及数据的不断积累,如何从现有的历史数据中发掘对用户未来决策有指导性的信息是计算机科学技术面临的挑战性任务之一。聚类分析技术通过根据数据的相
随着计算机网络技术的迅速发展,无线局域网(WLAN)因其不断提高的传输速率和灵活的移动能力而被人们越来越广泛地应用在各个领域。无线局域网采用无线媒介传输,具有信道开放的
合同网协议是多Agent系统(MAS)中解决分布式任务求解的重要协议,得到充分的利用和广泛的关注。随着研究的深入,合同网协议暴露出很多的不足,研究人员对其进行了扩展和完善,但