基于骨架的时空双流人体行为识别方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yuyangyy12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉中的一项重要任务。在家庭服务机器人研究领域,人和机器人之间的交互极其重要,机器人必须能够对人体的行为进行准确分类,才能更好地为人类提供更加精准、高水平的服务。早期的行为识别算法都是针对彩色图像序列进行的,随着廉价的深度传感器和实时的骨架估计算法的出现,基于骨架的行为识别引起了很多学者的关注。利用骨架数据不仅可以改善光照变化和视点变化的问题,而且可以忽略由于衣着、肤色、发型等产生的差异。本文综合分析了近年来基于骨架数据的人体行为识别方法,并考虑到家庭服务机器人的特性,围绕人体行为识别模型训练复杂、计算量大和识别精度低等问题展开研究,提出了一种基于骨架数据的人体行为识别方法,具体研究内容如下所示。首先,采用Kinect传感器获取到3D骨架坐标数据,进行骨架模型的表示。综合考虑时间演化和空间几何信息,建立了时间子网骨架模型表示和空间子网骨架模型表示。时间子网骨架模型求取了行为序列帧间之差,空间子网骨架模型求取了边的几何信息。总结出了人体骨架关键点提取与模型表示算法。其次,基于建立的时空子网骨架模型设计了一种端到端的包含时空信息的卷积-长短期记忆网络双流人体行为识别模型。该模型分为三个部分:第一部分是时间子网,第二部分是空间子网,最后是他们的融合部分。将时空骨架模型表示矩阵作为模型的输入,然后输入到1D CNN中进行下采样,提取出动作序列特征后,再将这些特征输入到基于LSTM的深度神经网络中进行学习,得到更深层次的时间依赖。为了将每帧最显著的骨架关节运动选择出来,为时域数据引入了注意机制。模型将时域和空域的高层特征联合起来对行为进行分类。另外,为了提高模型的泛化能力,本文在训练期间对骨架的3D坐标引入了旋转和缩放的数据增强技术。最后,在NTU RGB+D数据集的60种行为类别以及MSR Action 3D数据集的20种行为类别上对模型进行了验证。实验结果表明了本文提出的识别方法的可行性与有效性,与其他方法相比,所提方法表现出了更高的识别准确率。
其他文献
学位
一种产业支撑着一个城市的发展,历经千年这个产业仍然可以说是支撑着这个城市的发展。这个城市则是江西景德镇,景德镇因瓷而闻名中国,也因瓷而享誉世界,要认识景德镇,就有一个绕不开的话题:是瓷器。两宋之前,中国制瓷中心主要以北方五大名窑为主。而元朝以后,景德镇开始一枝独秀,成为中国制瓷中心。因此,景德镇的瓷制工艺一直延续至今。
期刊
传统人机交互方式如鼠标、键盘、屏幕点触式已广泛应用于康复医疗系统,其存在按键繁多、操作复杂等问题。因此,为了使康复系统更加人性化、易于操作,寻找更加和谐、自然的新型人机交互方式变得极为迫切。本文以YSU-I型坐卧式多关节下肢康复机器人的康复训练功能为基础,为其研发了YSU-II型下肢康复机器人智能交互系统,是一种新型人机交互的应用实例。系统以纸质表单作为输入方式,通过填写多个控制指令参数来设置康复
学位
学位
随着航空航天技术的发展,越来越多的人造卫星进入了太空,并为社会生产、城市发展、军事侦查等领域提供了巨大的帮助。但是遥感影像容易受到大气、电磁波等外界因素的干扰,且传统的基于单源数据的图像增强方法无法有效利用遥感影像的多源性特征。因此如何通过多源数据间的优势互补增强图像质量,如何对图像特征进行融合,成为图像处理领域的一个热点研究问题。本文就遥感图像融合技术进行了研究,在分析了遥感图像质量的主要限制因
学位
目前,评论信息在很大程度上改变了传统的消费观念,评论人发表的评价为商家及潜在的消费者提供了宝贵的评论信息资源,使得人们在购买的过程中对商品的质量有了一定的了解。然而,受利益驱动的影响,商家开始雇佣一定数量的评论人冒充普通消费者,并通过协调运作有组织地对某个商品进行虚假评论进而误导消费者。虚假评论群组的存在,对电商平台造成了极大的影响。因此,如何快速、准确地检测出虚假评论群组,营造公平公正的网络购物
学位
随着人工智能的高速发展,使得手势识别及手势估计等相关手势任务在计算机视觉领域越来越重要。比如人们不再满足单一人机交互方式,手势任务为人机交互提供了新思路。然而目前无论是手势识别还是手势估计的效果并不能真正满足一个符合现实需求的手势系统,因此如何更好地完成手势任务仍然是计算机视觉领域不可忽视的问题。随着深度神经网络的迅猛发展,手势相关技术也更加成熟。因此本文结合深度学习和计算机视觉等相关知识,对更好
学位
近几年,随着人工智能的飞速发展,人体行为识别技术也引起了人们的关注,如何快速准确地识别出人体行为,成为重要的研究课题之一。但是现在很多识别方法仍存在受外界环境影响较大,不能有效地利用人体结构以及人体动作特点,对数据信息利用不全面等问题。本文在分析了目前已有的研究方法以及存在的问题后,提出了两种新的人体行为识别方法。首先,在行为识别中,针对没有充分利用人体结构的特殊性和动作序列的长期依赖性这两个特点
学位
随着视觉建图技术的逐渐发展,语义建图技术成为SLAM领域研究的热点,语义地图是赋予机器人进行场景感知、人机交互以及行为决策等行为的基础。目前大多数相关研究工作内容是探索语义建图中语义信息的获取方法或三维地图融合语义信息的方法,这类方法仅为三维地图添加语义属性,而没有从本质上改善建图的性能。因此,本文在构建语义地图的同时,利用语义信息优化回环检测结果,探索具有实时性、准确性以及可行性的语义建图方法。
学位
近年来,我国经济发展迅速,国际影响力不断提高,我国股票市场成为影响全球金融指数的重要因素。随着IT技术的发展舆情数据量呈现指数级增长,传统的舆情分析方法已经不能成为投资者了解股市、掌握股市运作规律的有效手段。数据可视化技术是利用图形化手段传达数据信息并进一步挖掘深层次信息的有效方法。为了方便股民了解信息、给投资者提供参考、使股票市场健康发展,本文根据股票舆情数据的特点,采用数据可视化技术对股票舆情
学位