运动场景下人体动作分析算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:tangroo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展和应用,人工智能技术已被广泛地应用到体育运动的训练中。跳绳作为一项全身运动,在日常生活中发挥着越来越重要的作用,已被纳入到中招考试的项目中。当前,在跳绳教学中,专业的体育老师匮乏,导致学生训练效率低下;跳绳监测设备笨重且昂贵,人工统计的成本和精力太大。如何自动并快速地分析出跳绳运动过程中的动作是否符合规范,并给出正确的指导和训练计划成为了提高跳绳考试成绩的关键。现有的基于视觉的人体运动行为识别与分析算法复杂度高、鲁棒性差、计算负担过重,无法实时。此外,由于缺乏专业的人体运动动作分析人员,人体动作分析和运动质量评估方面的研究还需要进一步探索。因此在人体运动过程中,实现一种鲁棒性高,时间开销稳定的动作分析方法,对于运动过程中的动作分析和动作质量评估具有重要的意义。本文针对跳绳过程中的运动分析问题,首先,通过2D姿态估计算法获取跳绳过程中的关键点坐标,并对坐标进行预处理获取健壮性数据序列,其次将跳绳过程中的运动分析问题转化为多标签分类问题,并提出了一种新的多标签分类模型ALSTM-LSTM,最后,设计并开发了基于手机端的跳绳过程中的运动分析系统。主要研究内容如下:(1)提出了一种深度学习框架用来获取运动员在跳绳过程中的关键点坐标。该框架基于Open Pose方法,在图像特征图提取方面,为了减少模型的参数,提高识别的效率,使用轻量级网络模型Mobile Net V2替代VGG19;在网络优化方面,为了进一步提高Open Pose模型的精度和泛化能力,在损失函数中引入了权重和惩罚项,并在MPII数据集上验证了模型的有效性。最后通过不同的手机获取运动员一分钟跳绳过程的视频流数据,并通过改进的Open Pose方法获取人体的关键点坐标,并对获取的坐标进行预处理,即,以脖子、左臀部、右臀部三个关键点坐标的重心为原点建立直角坐标系,并更新全部坐标最终得到人体关键点序列。(2)根据获取的关键点坐标序列,本文将跳绳过程中的六种肢体动作标准与否问题转化为多标签分类问题;并根据多标签学习方法中的算法适应性方法提出了一种多标签分类模型ALSTM-LSTM。实验结果获得了95.1%的准确性,高于其他深度学习模型,并且在精度、召回率、和F1-score这些评价指标上也达到了最优。(3)利用构建的网络模型设计并开发了安卓端的智慧跳绳教学系统。该系统主要分析能够帮助跳绳运动员快速地了解自己在跳绳过程中存在的问题,从而帮助跳绳运动员改正跳绳过程中的错误动作,提高学生的跳绳成绩。
其他文献
伴随着《纺织工业“十三五”发展规划》的发布,中国的纺织行业正逐步迈向工业4.0时代。与互联网、大数据等技术的深度融合,各式各样的数字化智能纺织产品层出不穷,与此同时,
近年来,公共安全问题越发引起人们的关注。为了更好的解决城市安全问题,在人口密集的地方如商场、学校、电影院、游乐场、各大热门景点等地安装了大量的监控摄像头,这些摄像头汇聚在一起,形成一个巨大的监控网络,每天都会产生海量视频数据。但是处理这些海量视频信息大都采用传统的人工方式,通过人眼“盯屏幕”的方式从海量视频中寻找特定的几个监控信息,这样不仅费时费力、效率低下,而且容易遗漏重要信息,若有紧急情况发生
数字图像在人们生活中扮演着重要的角色。边缘则是数字图像中前景与背景的分界处,是图像的一个重要特征。边缘检测一直是计算机视觉、图像处理等诸多领域中的基础且重要的研究课题。在诸多边缘检测算法中,Canny边缘检测方法是目前理论上相对最完善的一种边缘检测方法。不过Canny算法在滤波去噪、梯度计算、边缘连接时的双阈值选择这几个步骤上都存在着缺陷,算法的自适应性较低。对于Canny算法中高斯滤波的缺陷,可
以牛顿法为代表的二阶优化算法已经被应用于解决稀疏学习问题并取得了良好的效果。这种算法与一阶优化算法相比主要的缺点是需要计算海森矩阵而会消耗大量资源,解决上述问题
本论文基于贝克斯快乐护理管理咨询公司在荷兰卫生,福利和体育部以及广东省卫生和计划生育委员会组织的中荷医疗创新研讨会上的商务配对口译任务。旨在讨论口译员在商务配对口译中的作用。本报告的目的是提高联络口译技巧,并为其他口译员提供参考。本报告由五部分组成:任务描述,过程描述,理论框架,案例分析和结论。任务描述主要介绍了口译,委托方和联络口译的特点。过程描述,从三个方面介绍了整个解释过程:前期准备,口译工
情感是人类对外在事物的主观感受,面部表情是传递人类内心情感的一种有效的方式。若能准确地识别出人脸的表情并分析其内心情感状态,将能更好地改善人与机器之间的交互关系。
自动引导车(Automated guided vehicle,AGV)可以提高物料的运输效率,节约人力。AGV的冲突与死锁避免及任务完成效率是如今较为关注的问题。本论文主要研究如何在避免冲突与死
观看电影已经是人们日常生活中重要的娱乐方式之一,由于电影信息分布于各大视频网站且这些网站不能为用户提供足够个性化的查询结果,导致用户难以搜索到自己感兴趣的影视资源。针对该问题,本文将网络上分散的电影信息组织起来,建立电影信息本体知识库,将K-近邻算法和本体查询方式相结合,对用户观看电影的历史记录进行分析,得到用户的兴趣倾向,从而为用户提供他们期望检索到的电影信息。本文的主要工作和贡献如下。首先,针
图像数据作为大数据时代信息的重要载体,是人们了解与认识世界的重要方式之一。但受限于成像设备、环境等因素,现实中获得的图像往往会丢失很多细节信息,无法满足人们的日常
从最初的计算机之间的相互联接,到如今的趋向于万物互联的物联网时代,互联的对象越来越丰富多样。但由于物联网各方面的异构性,目前的物联网生态仍处于一个碎片化、孤立化的