基于深度学习的人体动作识别研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hangarfield
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域的一个重要研究方向,在智能监控、视频理解、人机交互、辅助驾驶等众多方面都有着巨大的应用需求。本论文对人体动作识别当前研究现状进行了综述总结,在此基础上,对基于视频的动作识别和基于三维姿态的动作识别进行了进一步的研究。针对基于视频的动作识别方法的实际应用,论文设计并实现了一个实时在线的动作识别系统。为应对实际应用中的多项问题,系统设计包含了目标检测、目标跟踪、光流修正、动作识别及后处理等多个模块。目标检测和目标跟踪是实际应用中的重要预处理步骤,通过对目标进行定位,系统能够集中处理目标区域图像,从而大大减少了多变环境带来的干扰,也保证了系统在不同环境下的适用性。在动作识别模块中,系统采用了一个基于光流的CNN网络,以目标的叠加光流图像为输入,对动作进行分类。在光流修正模块中,论文对相机运动造成的光流进行了消除,抑制了相机运动对于目标动作的影响。论文对整体系统进行了整合和优化,使之达到了实时运行的标准,能够应用于真实场景下的在线动作识别。论文对基于三维姿态的动作识别进行了进一步的方法研究,提出了一个基于注意力机制的多视角重观测融合模型。注意力机制是一种对重要特征给予更多关注来帮助提高特征表达性能的方法,模型中结合LSTM网络提出了对于特征的多层注意力增强的方法,通过在网络的多层中叠加进行注意力操作来提高网络的性能。考虑到观测视角在动作识别中的重要影响,模型中提出了多视角重观测融合方法,对动作进行多视角的重新观测并融合观测结果来提高动作识别性能,并且模型通过视角融合中的注意力操作,学习根据动作序列信息寻找适于识别的观测视角,进一步提高动作识别的效果。整体模型整合为一个端到端的网络模型,在主流数据库上取得了当前领先水平的动作识别效果。
其他文献
对复合磷酸盐、复合增稠剂与复合碱对面条品质的改良作用及它们的复配增效作用进行了研究.结果表明,采用复合碱,复合磷酸盐及复合增稠剂复配而成的复合添加剂能明显改善面团
在中国文学的研究中,我们感受到了两种趋势:一是古代文学博士点的增加带来的研究队伍的扩大;二是由于资源的不可再生而引起的学术创新度的弱化.因而,古代文学研究在新世纪初
为了解决公共交通无法实时定位、远程调度和管理水平低下的问题,设计了基于GPRS的智能公交管理系统.首先,进行了智能公交管理系统整体架构设计.然后,进行了智能公交管理系统
教学难点是指学生不易理解和掌握,教师难以讲清的教学点,其实质是学生与教材间较为突出的矛盾.初一新生刚从小学毕业,地理知识很有限,初中地理第一章、第二章涉及到地球的运
以攀枝花市米易县为研究区域,采用GIS技术,选取坡度、坡向、坡形、地层岩性和相对高差等5个指标作为评价因子,利用贡献权重模型对研究区的滑坡地质灾害进行危险性评价。评价
信息技术的进步使得软件开发得到全面的推广,为人们的生产和生活提供不可或缺的技术支持,而在软件开发中数据库设计是保证其正常使用的基础,数据库的设计需要结合实际,采用更
潍坊市普及基本医疗卫生制度实验研究主要通过提高医疗保障水平、扩大覆盖面来提高卫生服务的可及性,本文从基本医疗保障、小病社区低收费、大病就医保障和贫困人口医疗救助
目的:探讨64排螺旋CT动态增强扫描对肾癌亚型诊断价值,提高对肾癌的诊断准确率。方法:22例经手术病理证实的肾癌(其中透明细胞癌11例,乳头状癌4例,嫌色细胞癌7例)进行动态增强CT
<正> 血清皮质醇及甲状腺激素的变化与中医的辨证分型密切相关。目前,在探讨阴阳虚损与肾上腺功能和甲状腺素的关系方面已有不少报道,而对于气虚证与肾上腺功能及甲状腺激素
油液检测技术是液压设备状态监测和故障诊断技术的一个重要方面。由于工程机械的使用工况复杂、工作环境恶劣和油液污染较严重等原因,使得现有光谱、铁谱分析技术在工程机械