图像和深度图中的动作识别与手势姿态估计

来源 :浙江大学 | 被引量 : 0次 | 上传用户：gzhguozhihong

【摘要】

：

让计算机理解人的行为活动是人机交互和人机协作的前提条件。机器学习理论的快速发展使基于视觉的人体活动分析研究日臻成熟。有些领域的发展水平已可以满足实用需求，比如指纹

【作者】

：

李瑞

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2019年期

【关键词】

：

动作识别手势姿态估计图像分割深度图

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

让计算机理解人的行为活动是人机交互和人机协作的前提条件。机器学习理论的快速发展使基于视觉的人体活动分析研究日臻成熟。有些领域的发展水平已可以满足实用需求，比如指纹识别与人脸识别。有些领域的发展水平则相对欠成熟，比如动作识别与手势姿态估计。作为人体活动分析的两个重要分支，动作识别与手势姿态估计为人机交互和人机协作有关应用提供了理论解决方案。本文研究了图像和深度图中的动作识别与手势姿态估计:　　提出了两种由分层表示实现空间建模的静态动作识别方法。第一种方法以SIFT为局部特征描述子，利用Fisher向量编码SIFT，以空间金字塔为分层表示策略。第二种方法采用最新的八种预训练深度网络提取特征，以包含重叠区域的划分为分层表示策略。　　提出了一种有监督时间序列分割导出的离线动作识别方法。提出的方法构建在结构化时间序列框架下，将三维骨骼视为多维空间中的一个点，利用动态时间归整(Dynamic Time Warping，DTW)解决动作执行速率变化问题。每个训练序列作为字典中的原子用于岭回归(Ridge)实现的协同表达，根据协同表达得出的重建误差完成动作分类。鉴于重建误差在l2-范数意义下连续地度量了测试序列和训练序列的相似性，进而提出了一种有监督时间序列分割算法。提出的算法除了可以用于离线动作识别，还可以用于运动序列分割和其他一般时间序列分割。　　提出了两类将深度图和三维骨骼序列相结合的在线动作识别方法。第一类方法采用三维骨骼序列中的成对相对关节位置描述人体姿态，采用源于深度图的局部占有模式(Local Occupancy Pattern，LOP)刻画交互物体的形状，通过K-SVD为每个动作从训练序列中学习一个可视为冗余数据紧凑表示的字典，帧层次动作识别由正则化线性回归实现。第二类方法利用深度运动图(Depth Motion Map，DMM)描述动作。为了将传统意义上用于离线动作识别的DMM扩展到在线动作识别，提出了一个离线随机分割算法和一个在线顺序分割算法来生成DMM所需的子序列。为了增强DMM对静态动作和差异仅在姿态时序的动作的判别能力，引入三维骨骼位置和速度作为DMM的互补描述子。　　提出了一种基于深度残差网络的手势姿态估计方法。为了凸显残差模块的改进作用，首先搭建了一种普通深度网络，分析了批次标准化对其产生的影响。在此网络基础上引入了残差模块，从网络宽度和网络深度两个方面对搭建的深度残差网络进行了优化，并且研究了瓶颈层的作用。　　提出了一种深度相机动态跟踪性能测定方法。传统测定方法重点研究深度相机的静态测量精度，但是动作识别与手势姿态估计更关注深度相机的动态跟踪性能。为了探索深度相机是否已经成为制约动作识别与手势姿态估计发展的硬件瓶颈，以Kinect v2和Intel RealSense SR300为例借助于数控直线滑块导轨机构系统地研究了被跟踪物体相对于深度相机的位置、运动速度、运动方向对深度相机跟踪准确率产生的影响。　　基准数据集上的评估实验表明，提出的动作识别与手势姿态估计方法几乎均可以与最新的方法相媲美，有的方法甚至打破了现有最佳记录。深度相机的动态跟踪性能测定结果表明，在不考虑人手检测的情形下深度相机即将成为制约手部动作识别与手势姿态估计进步不可忽略的因素。为了适应新方法的提出，有必要采用更高精度的深度相机发布标注更准确的基准数据集。

其他文献

稿件种种

腹稿:在大脑中进行构思、尚未动笔写作的稿件。草稿、初稿:初次写出、尚未改定的稿件。脱稿:脱离草稿,指已经修改抄正的稿件。手稿:由作者亲笔书写的稿子。特稿:为宣传特定

期刊

敬称

基于行业企业与专业人才培养双向需求的油气录井技术课程建设

【摘要】行业企业的需求是高校课程建设的动力与源泉，现代高职教育要求课程建设的改革要以行业企业的人才需求为导向。课程是实现高职教育目的和人才培养目标的基本途径，其结构和内容体系的构建是否科学、合理对专业教学和人才培养目标的实现关系紧密。分析了录井在油气勘探开发和专业人才培养中的地位与作用，针对高职油气地质勘探技术专业的人才培养目标，明确了录井技术课程定位和培养目标，构建了课程的结构体系和教学内容体系

期刊

录井技术企业需求人才培养课程建设

基于气动弹跳腿的单足机器人垂直跳跃动态特性研究

单足跳跃机器人涉及气动和液压伺服系统、多体系统动力学、自平衡控制等多学科的基础理论和关键技术，是研究多足行走式机器人的必备基础。本文以单足机器人作为研究对象，研究其

学位

单足机器人气动伺服系统稳定跳跃可控高度跳跃

试论装饰基础课程在环境设计专业中的定位

【摘要】本文主要阐述高等院校环境设计专业中开设装饰基础课程的必要性，对于环境设计人才的培养与发展具有一定的理论与现实意义。　　【关键词】环境设计传统装饰课程设置　　【中图分类号】G642 【文献标识码】A 【文章编号】2095-3089（2014）11 -0035-02　　一、当前环境设计专业课程体系设置中存在的问题　　环境设计专业涉及建筑室内外环境设计和艺术设计两大学科，由理论教学体系和实践

期刊

环境设计传统装饰课程设置

在第二课堂中培养幼儿教师专业技能探究

【摘要】随着社会对高质量学前教育的需求，幼儿教师职前专业技能培养显得尤为重要，本文提出了通过第二课堂培养幼儿教师专业技能的观点，并对其可行性进行了简要分析，最后提出“五个结合”的具体措施，以克服通过第二课堂培养学生专业技能的不利因素。　　【关键词】第二课堂幼儿教师专业技能　　【中图分类号】G655 【文献标识码】A 【文章编号】2095-3089（2014）11 -0034-02　　近年来随

期刊

第二课堂幼儿教师专业技能

漫话齐山云雾瓜片

金寨县地处皖西大别山区,产茶历史悠久。据“罗田县志”和“文献通考”记载:宋太祖乾德三年官府曾在麻埠街、开顺街设立茶叶收购站,可见当时已颇具规模。 Jinzhai County i

期刊

产茶历史罗田县乾德文献通考开顺皖西大别山区当时公元金寨县云雾

推广抗瘟品种是防治薯瘟的有效途径

薯瘟病是甘薯一大病害。此病侵染力强,蔓延快,为害重,防治困难。闽东在七十年代初传入此病,目前已延遍大部薯区。十年来,宁德地区广大社员在与薯瘟斗争中总结了一条控制薯瘟

期刊

甘薯品种品种控制侵染力病区七十宁德病害晒干率高产品种苗期

基于单片机的USB打印机打印系统研究

近年来,随着打印机技术的不断发展,打印系统的集成度越来越高,打印机控制方式也呈现多元化趋势。单片机技术的不断发展为实现非PC端控制打印提供了可能,通过单片机实现直接对

学位

图像打印喷墨打印机USB接口

多专业综合仿真实验平台在经管类专业实践教学中的应用

【摘要】多专业综合仿真实验平台对于提高经管类学生的实践能力发挥着不可替代的作用。本文主要探讨了多专业综合仿真实验的具体构建方案。　　【中图分类号】G642 【文献标识码】A 【文章编号】2095-3089（2014）11 -0036-02　　一、我国经管类专业实践教学现状　　在国内大学中，经管类专业学科数量繁多，专业应用性强。实践教学环节在专业人才的培养中起着至关重要的作用。传统的实践教学手段以专

期刊

多专业仿真实验平台经管类学生专业实践教学能力发挥构建方案

兰德大学数学教学的启示

【摘要】作者以访学的亲身经历，介绍美国兰德大学数学教学的课程设置和教学安排，从分层教学、教学内容、课堂教学、应用现代技术、考试和成绩的评判等方面介绍兰德大学的数学教学特点，并提出对国内教改的启示。　　【关键词】课程设置教学特点教学改革　　【中图分类号】G642 【文献标识码】A 【文章编号】2095-3089（2014）11 -0039-03　　2014年1月到7月，笔者在美国北卡罗来纳州的兰

期刊

课程设置教学特点教学改革

图像和深度图中的动作识别与手势姿态估计

与本文相关的学术论文