室内场景中的人体行为识别算法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:saddd11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别技术是指计算机通过分析视频序列,实现计算机自动检测视频图像中的人体行为并识别行为具体类型的过程。行为识别的本质是时变数据的分类问题,论文通过研究室内日常生活中人体行为的特点,在对比分析现有行为识别算法的基础上,针对室内场景,重点就特征提取和行为分类两个方面展开研究,主要研究成果如下:(1)特征提取:针对底层局部时空特征数量少以及中层特征表达能力弱的问题,结合视频深度信息提出一种用于行为识别的时空深度特征(Spatial Temporal Depth Feature STDF)。该特征依据运动剧烈区域在行为识别中提供更多的判别信息的思想,利用视频图像的深度信息确定人体运动显著性区域,通过计算区域内光流特征作为度量区域活跃度的能量函数,依据能量函数对运动显著性区域进行高斯取样,使样本点分布于运动剧烈区域。将采集到的样本点作为动作底层特征描述人体行为,利用词袋模型完成中层特征表达。实验中,提取STDF特征后利用支持向量机分类器对行为进行识别。实验结果表明,在SwustDepth数据集中,基于时空深度特征的人体行为识别算法的平均行为识别率达92%。(2)无监督式实时连续行为识别:针对现有的行为识别算法多是只能对已经分割成单一行为的视频片段进行识别的不足,提出了一种结合谱聚类和主题模型的无监督式行为识别算法。算法利用谱聚类生成视觉单词,避免传统聚类(K-means等)方法所导致的局部极值和初值敏感的问题。利用谱聚类生成词袋模型中视觉单词,将视觉单词作为主题模型的输入,用于pLSA模型和LDA模型的训练和检测。算法首先对包含多种行为的视频进行定位,然后针对自动定位到的人体行为进行识别。实验表明算法对于包含多个简单行为的长视频能够进行行为的定位和行为的识别。
其他文献
随着互联网技术的迅猛发展,以及不断扩大的数据库规模,数据挖掘技术在中医学中的应用也变得越来越突出。中医学中一个重要的组成部分是方剂学,它是中医基础理论与临床的纽带
随着世界各国车辆数量的急剧增加,交通状况日益受到人们的重视。如何有效地进行交通管理,越来越成为世界各国政府和有关部门所关注的焦点。针对此问题,各种智能交通管理系统
物体的三维重建问题是虚拟现实和三维可视化领域的研究热点。论文主要研究物体三维数据点云的实现技术。以双目立体视觉的基本原理作为理论依据,构建由多台CMOS摄像机构成的
地震、火灾、矿难等灾难发生后,在废墟中搜寻幸存者给予必要的医疗救助,并尽快救出被困者是救员人员面临的紧迫任务。近年来为了满足救援工作的需要,国内外很多研究机构开展
视频监控是图像处理和计算机视觉领域的研究热点,近年来引起越来越多人的关注。视频图像中运动目标检测效果的好坏,会对图像分割、目标跟踪和行为理解等后期处理产生重要的影
数据挖掘是数据库中知识发现的一个重要步骤,传统数据挖掘是以数据对象作为研究基础的挖掘方法,注重算法的运行效率以及模型的准确率,是一种面向数据或者称为数据驱动的数据
随着家庭系统的数字化、网络化的发展和家庭数字产品的日益多样化,一个能对其进行统一、系统管理的系统就显得很迫切。本文在这样需求下,研究了一个基于Widget、UPnP和P2P技术
P2P技术为资源共享、协同工作等网络应用提供了一个自由开放的平台,带给用户一种更方便直接的交流方式。但是随着P2P技术的迅速发展,一系列问题也随之而来。P2P不但给网络安全
教与学优化算法(Teaching Learning based Optimization Algorithms,TLBO)是近年来提出的一种新颖的群体智能算法,模拟的是现实生活中教师教学与学生学习从而提高学习成绩的
现实世界中的流体现象十分丰富,其中,最有趣,最具挑战性,也最复杂的现象主要来自于流体与其他物体交互的过程。近年来,有关流体与静止或者运动物体的交互已经引起计算机图形学研究