基于深度视频的人体行为特征表示与识别

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yangxfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别技术具有非常广泛的应用前景和巨大的社会经济效益,其在视频监控、人机交互、医疗健康看护、虚拟现实等领域具有广泛应用前景。近年来,随着图像获取技术的进步,尤其是微软Kinect图像采集设备的推向市场,深度图像的获取越来越容易,这给解决传统人体行为识别研究中的许多困难问题提供了全新的思路。目前基于深度视频的人体行为识别研究主要集中于深度序列中的特征提取与特征表示工作,虽然已经发表了许多深度视频中人体行为的特征表示方法,但如何提取对行为识别更具帮助的特征仍需要更加深入的研究。  为了获得具有判别性的特征表示,本文提出了基于深度视频LBP算子和稀疏表示的人体行为识别描述符。该描述符首先提取深度视频中基于深度和基于表面法向信息的LBP算子,并通过对其进行立方体方式和时空金字塔方式的组合作为初级特征;然后使用稀疏表示模型训练初级特征字典获取它的稀疏表示;最后将原始深度视频使用自适应的时空金字塔划分为若干个子序列,在每个子序列上使用时空池化方法规格化初级特征与每个字典原子的加权差异,得到深度视频中人体行为的高级特征表示。  为了降低深度视频中人体行为识别研究的数据计算量,加快人体行为识别方法的识别速度,本文提出了改进DMM图的快速人体行为识别方法。DMM图代表着深度视频中运动能量的累计信息,本文对原始的DMM图进行了改进:在DMM图中引入了时间金字塔概念,将原始深度序列转换为了P-DMM图。一个动作对应的多个姿态由多幅P-DMM图表示,在保留了类别信息的同时最大程度降低了数据计算量。为加快实验速度,本文在P-DMM图上提取了简易快速的HOG特征和LBP特征并通过特征融合作为深度视频中人体行为的特征表示。  最后,在公开的动作识别数据库MSR Action3D和动态手势识别数据库MSRGesture3D上的实验证明了本文提出的两种特征表示的有效性和优越性,本文提出的两种深度视频中的特征表示方法具有积极意义。
其他文献
无线网状网络(Wireless Mesh Network,WMN)作为Internet“最后一英里”的接入方案,能够提供一种灵活且低成本的多跳通信。随着近年来智能手持设备的快速发展,各类基于无线网络的
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息爆炸的时代。但是,面对海量的信息,从中找到自己感兴趣的信息是一件非常困难的事情,因此出现了“信息过载”的现
散列函数作为现代密码学的重要研究分支,是实现数据完整性验证、身份鉴别和数字签名的关键。但是随着信息技术的发展和理论研究的深入,传统散列算法暴露出一些缺陷,如执行效
云计算是近年新兴的一种计算模式,这种模式出现不久便迅速成为学术界研究的热点,工业界也推出了各种云产品。在云环境中集约部署软件系统,可以减少硬件设备的投入,在一定程度上节
安全问题自云计算提出以来就一直困扰着云服务的提供者和使用者,随着云计算的流行与普及,越来越多的黑客们更加关注云平台漏洞挖掘与利用。因此关注云计算安全,增加云计算的
卷积神经网络(Convolutional Neural Networks,CNN)目前在计算机视觉领域应用广泛,在图像识别、物体检测以及图像分割等问题上都取得了最优的性能。但是CNN是深度的人工神经
近年来,人均汽车保有量不断上涨,虽然部分大中型城市采取了尾号限行的措施,但是交通拥堵的状况依然愈演愈烈。尤其是早晚高峰期间及节假日的庞大交通流量使得负荷早已接近饱
随着移动互联网技术的高速发展和“互联网+”的提出,互联网业务应用需求日益多元化和复杂化以及网络规模急剧膨胀,对于网络数据传输路径的优化以保障网络数据的高效转发提出了
随着互联网的广泛应用,报表已成为企业信息统计的主要手段。报表用表格、统计图等格式动态显示数据,使得数据和格式完全分离,不仅可以准确快速的统计企业数据,还具有权限控制
近年来,随着技术的发展,移动设备在人们的日常生中扮演着越来越重要的角色。相对于传统的个人计算机,移动设备凭借便携性和日趋强大的功能,逐渐成为们获取和处理信息的一种重要手