基于深度视频序列的人体行为识别方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:kinglovechina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频摄像机的普及,使得各种类型的视频数据数量飞速增长。基于视频序列的人体行为识别技术已成为计算机视觉、模式识别领域的重要课题,基于视频序列的人体行为识别主要通过分析视频的内容对人体行为进行检测和识别,人体行为识别技术与社会生活密切相关,其在智能监控、人机交互以及医疗辅助等多个领域都有重要应用。由于具有广阔的应用前景,基于视频序列的人体行为识别近年来已经吸引了国内外计算机视觉研究者的广泛关注。  如今,计算机不能够像人类那样智能的识别处于复杂环境下的各种行为信息,主要原因在于计算机不能处理光照变化、视角变化以及目标遮挡等环境因素的影响,并且人体行为往往变化多端,动作细节会随着时间的变化而演变。目前,大部分人体行为识别方法是基于彩色视频序列的,识别结果易受光照变化、目标遮挡和复杂背景等因素的影响。近年来,随着深度传感器的出现,使得利用不受光照和表观因素影响的深度信息来提高人体行为识别的效果成为了可能,针对这种新型的深度序列数据,如何利用深度信息描述人体的行为特征,实现鲁棒的人体行为识别,还需要深入研究。因此本文对如何解决基于深度视频序列的人体行为识别问题进行深入探索之后,又对人体深度特征的表示方法进行了研究,提出了一些改进的方法和措施。本文的主要工作具体内容如下:  (1)提出了一种基于多分辨率曲面法向量的人体行为识别描述符方法。基于曲面法向量的方法一般具有抗噪声能力与尺度不变性的特性。因此,在本文的行为识别算法研究中应用了基于曲面法向量的方法。该方法的主要思想是通过在特征空间内应用局部多分辨率金字塔,聚合不同层上的多维法线,提取不同层的底层特征,通过学习到的稀疏字典对其编码,应用空间平均池和时间最大池整合编码,得到高层特征作为最终描述符。该方法有效地提高行为识别描述符的灵活性,大大提高了识别率。  (2)提出了一种用于分类的组稀疏约束字典学习模型。为了更好地对人体行为进行分类,本文利用组稀疏编码适用于分类的这一特性,并结合时空特征相似性以及人体运动的本质特征,在原组稀疏编码方法上做出了优化与改进。本文提出的模型是在传统的稀疏字典学习模型基础上,通过增加组稀疏约束,不但在保证极小化信号的重构误差的条件下,对信号重构误差和系数的稀疏性做了限制,而且利用每个训练样本的类别信息,为每个类的样本学习不相关的类别字典保证其判别性,组合这些子字典以获得判别能力更强的稀疏字典,从而降低系数分布的随机性,提高分类性能。  最后,为了验证本文方法的有效性,应用本文提出的描述符方法和组稀疏约束字典学习模型,在4个深度视频序列的基准数据集上进行了实验验证,实验结果表明,本文提出的两种方法对人体行为识别是有意义的。
其他文献
随着计算机技术的飞速发展,多处理器系统和多核芯片变得越来越常见。在设计各种复杂的计算机系统时,形式化验证技术在保证设计正确性和寻找系统漏洞方面也起着越来越重要的作用
门户可以将各种异构应用和数据资源集成到同一用户界面下,并根据用户或角色的不同,形成个性化访问页面,从而实现信息的有效传递。门户做为信息集成与发布的有效手段已经获得了广
学位
空间科技是国家发展的重要战略领域,随着空间科学和应用载荷的技术不断发展,对在轨数据传输与处理的要求越来越高,信息网络技术也亟需提高。载人空间站开展大规模空间科学和应用
学位
图像的多尺度表示是一种类似于人类视觉系统的图像分析方法,目前得到了人们广泛地关注。客观世界中物体的特征表现在某一特定的尺度范围内,在不同的尺度下,人类视觉感知所获
随着技术的发展和人们需求的增加,图像视频信号的质量和精度日益提高,所获取的数据量也是越来越大。因此关于图像视频的编解码技术的研究,得到了长期的关注和发展。压缩感知理论
随着经济的发展、人民生活质量的不断提高,智能化小区的规划设计与建设在很多地区已渐成热点,安防产业的市场前景越来越被看好。作为安防一部分的可视对讲系统的数字化已经成为
随着社会的发展,企业业务已经进入了“随需应变”的时代。为了适应企业业务的这一特点,提高企业的综合竞争力,一个可行的途径是将企业内外部的各类业务应用系统及各类信息进行适
移动对象数据库技术 (Moving Objects Database,MOD) 近年来受到了越来越多的关注,已成为当前数据库领域的研究热点。与传统数据库不同,MOD技术主要研究移动对象位置及其相关信
以实时多媒体数据通信为代表的宽带网络应用已逐渐成为互联网承载的主要应用及流量类型之一.在这些应用中,有相当一部分具有群组通信的性质,为了节约带宽资源,提高转发效率,