基于深度图像和骨骼数据的行为识别

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:q3177848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着计算机技术的飞速发展,人体行为识别逐渐成为计算机视觉研究领域的热点。目前相关行为识别技术已经广泛应用于监控、视频游戏、人机交互、医疗保健等方面。早期人体行为识别大量采用基于彩色RGB图像的识别方法,但受光照等诸多因素,对识别结果影响较大。利用深度相机得到的深度图像和骨骼数据可以很好地解决诸如光照问题,同时对背景颜色的变化不敏感,大量采用上述数据进行人体行为识别的方法被提出,促进了行为识别的发展。深度相机可以获得RGB图像和深度图,同时从深度图中提取骨骼数据。为了利用更多深度图像和骨骼数据的动作信息提高动作识别率,本文基于深度相机提取的骨骼数据和深度图像对人体动作识别方法进行以下研究,提出了以下两种人体行为识别算法。第一,提出一种改进的基于深度图像和骨骼数据的动作识别方法,该方法使用深度图像序列生成运动历史点云并提取全局特征,同时从三维骨骼信息中提取人体骨骼关节点的相对位移特征和相对距离特征,使用VLAD算法归一化生成骨骼特征。对得到的点云特征和骨骼特征进行特征融合,构建出一种多模特征融合的动作识别方法。在MSR-Action3D和UTKinect-Action3D两个数据集进行实验,证明该方法对于较复杂的动作序列的有较好的识别效果,并且在高难度的交叉测试中相对已有方法识别率有所提高。第二,受双流网络识别人体动作启发,本文提出了一种基于骨骼能量图和深度运动图的双流网络模型。首先基于骨骼序列的视图不变变换来消除视图变化对骨架关节的时空位置影响,然后将变换的骨架动作序列可视化为一系列的彩色图像。将得到的彩色图像叠加得到骨骼能量图,使用图像腐蚀方法进一步增强骨骼能量图。增加一个人体动作的深度运动图输入流,形成一个新双流卷积神经网络框架,以此提取连续动作帧中的时空信息。实验证明在Northwestern-UCLA数据集和UTKinect-Action3D数据集上,该方法有较好的识别效果。
其他文献
内部威胁作为严重的信息安全问题受到广泛关注和重视,随着信息系统内部不安全事件的不断发生,不论是员工误操作还是出于某种目的得行为,如何有效检测和预防内部威胁的发生成
在当前机器学习的研究中,面对真实世界应用场景开放性的分类已经受到越来越多的重视,且已经出现了一些研究领域,如零样本学习(Zero-Shot Learning)、类别增量学习(Class-Incr
随着互联网普及率的提升,各种社交App发展日益成熟,网络用户人数不断增加。截止至2019年2月,据统计我国用户目前使用最广泛的社交软件——微信的安装率已经达85.8%,每月活跃
近年来,中国加快了资本市场对外开放的步伐。在对外开放过程中,采取了以香港为口岸间接逐步开放的模式。沪港通和深港通的开通促进了内地与香港市场的融合。一方面,相对成熟的港股市场可能给内地市场带来正向外溢效应;另一方面,国际资本市场的风险因素也有可能通过港股市场传递到内地市场。在此背景下,将内地市场与港股市场纳入统一的分析框架,研究该体系的系统性风险意义重大。本文运用Adrian和Brunnermeie
3μm中红外光纤激光在遥感、医学和国防领域具有重要而广泛的应用。掺杂稀土离子的光纤激光器结构紧凑,光束质量好,输出功率较高且具有优异的散热性能,得到了研究者的青睐,本
草原畜牧业作为中国的一种传统产业,近年来面临着很多挑战。随着规模化,集约化养殖业的发展,在健康养殖的概念下,找到适应现代化、规模化的养殖场的监控方案,对规模化养殖场
近年来,随着商业信用在企业经营活动和融资活动中的地位越来越重要,也依托于备受业界和学界关注的投融资关系研究,对商业信用这项经营性负债与投资效率关系的研究也逐渐发展
随着移动互联网的飞速发展,无线通信网络中的接入设备越来越多,移动用户对数据业务的需求也日益增长。相应地,无线频谱资源的紧缺已经成为了当前通信系统发展亟待解决的一大
棉花是一种关系到国计民生的重要战略资源,涉及到人类生活的多个行业。棉纺织企业对皮棉的高质量需求、国际市场的竞争、以及国家政策的调整,使得提高棉花加工质量成为当务之
强激光与原子、分子、等物质的相互作用包含着众多新奇的物理现象,是物理研究的重点和前沿。飞秒技术的快速发展,使得强激光场中原子分子产生的高次谐波有了广泛的应用和重要