基于深度学习的人体动作识别

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:racheal2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别因为其广泛的现实应用前景,成为图像处理、计算机视觉、机器学习等领域的研究热点,但仍然是一个具有挑战性的课题。在人脑视觉机理的启发下,深度学习的提出使得机器学习取得突破性的进展,也为人体动作识别的研究带来了新的方向。深度学习基于一系列算法,通过分层非线性转换无监督地获取数据的高层抽象。不同于传统的识别方法手工提取特征,深度学习能够自动地从低层次的特征中学习出高层次的特征,解决了特征选取过于依赖任务本身和调整过程耗费时间等问题。本文重点研究在复杂场景下的人体动作识别及运动视频中时空特征的提取问题,克服环境差异和时间变化给识别造成的困难。本文在研究深度学习典型模型卷积神经网络和深度置信网络的基础上,提出了具有创新性的人体动作识别模型。本文的具体研究工作如下:(1)研究了复杂场景下RGB图像中人体的动作识别问题。卷积神经网络由于局部权值共享和池化的特殊结构,对于特定的姿态、光照、环境杂乱变化均具有不变性,在图像处理方面具有天然的优越性。因此,本文提出一个改进的卷积神经网络模型,提取2D图像序列中的动作特征,并经过softmax回归进行分类。其中,为了更有效的预训练卷积核权值,本文还利用卷积自动编码器替代传统的后向传播算法进行初始化工作。试验表明该模型有效地解决了复杂场景下动作识别问题,较传统方法具有更高的识别率。(2)针对运动视频中的时空特征进行研究。为了使识别方法更具实用价值,本文提出了一个多分辨率的3D卷积神经网络模型。在保留高分辨率的原始输入流的前提下,增加一个包含动作的低分辨率输入流,形成一个新的双流3D卷积神经网络框架。这样既能够利用3D卷积核提取连续视频帧中的时空信息,又加快了网络的运算速度。实验证明,此方法无需任何先验信息取得了和传统算法相近的结果。(3)前两个研究点均为基于RGB图像序列的特征提取方法,第三个研究点则提出了一个基于RGB-D视频数据的识别模型。该模型通过传感器Kinect获取深度图像序列,并进行一定处理获取低层时空信息,再通过一个金字塔型的深度置信网络模型进行高层特征表示。其中,辅以改进的限制波尔兹曼学习算法,较本文之前的算法极大地减小计算量。实验表明较其他优秀方法,本文的方法更具有效性和鲁棒性。
其他文献
“想要了解一个政府在做什么,只需要去看它的预算”。作为国防建设领域的计划,国防预算影响着一个国家的国防和军队建设。$$美国作为世界第一军事强国,其国防预算的“诞生”过程
报纸
人才是高校改革和发展的战略性资源,高校间的竞争归根结底是人才的竞争。随着高等教育体制改革的逐步深化,高等教育大众化进程的逐步发展,新建本科院校面临新的发展机遇和挑
目的评估乳腺影像学报告及数据系统(BI-RADS)诊断标准与超声弹性成像(UE)改良5分法判断导管内肿物良恶性的诊断价值。方法回顾性分析手术病理证实的100例患者共107个病灶(良
本文从对阿尔贝尼斯音乐风格形成的起因出发,力图挖掘阿尔贝尼斯不同时期音乐的创作特征,探寻阿尔贝尼斯音乐中的民族风格。从西班牙历史文化以及人文环境、其他作曲家、法国
餐饮企业的竞争是"人才"的竞争,而人是各项生产要素中最核心的主要因素,员工的培训是人力资源管理中的重要内容。培训与保持企业的核心竞争力,很大程度上取决于餐饮企业是否
本文介绍了一种多用途的真三轴试验仪.它由计算机控制,具有三个方向独立控制加载的功能.其形变检测采用自制的光栅位移传感器,可实现所有测点的同一时刻采样.
从人口、土地、经济、社会、生活五个维度构建新型城镇化发展水平综合评价指标体系,采用专家咨询与层次分析法确定指标权重,通过线性加权综合评价法确定了五指山市2009—2014
城镇化质量水平对我国新型城镇化发展起至关重要的影响作用。以西南民族地区28个地级市为研究样本,通过构建评价人口就业质量、经济发展质量、居民生活质量、城乡一体化发展
在视频作品中,为了突出某个场景的视频效果,或者要同时展示几个相关的场景,我们经常会采用“电视墙”式的处理手段。在Premiere中,可以有多种方法来实现“电视墙”效果,这里,
储气库作为有效的天然气调峰技术,具有库容大、安全性好、储转费低等优点,可确保输气管网高效运行。我国储气库建设相对滞后,总工作气量缺口较大。通过对比分析国内外地下储