【摘 要】
:
理解人的行为活动是机器人与人进行智能化交互的前提条件。随着深度学习技术的快速发展,使基于视觉的人体活动研究日渐成熟。有些领域的发展水平已经满足了实际需求,例如人脸识别与指纹识别。而有些领域的发展水平还相对欠缺,例如人体姿态估计与行为识别。在人与机器人交互过程中,人体姿态是重要的信息来源,能很好地描述人体的运动姿态与动作,对理解人的行为有重要作用。而行为识别是更高语义的视觉任务,为机器人与人的交互提
【基金项目】
:
广东省前沿与关键技术创新专项项目(2017B050506008); 广东省重点领域研发计划项目(2019B090915001);
论文部分内容阅读
理解人的行为活动是机器人与人进行智能化交互的前提条件。随着深度学习技术的快速发展,使基于视觉的人体活动研究日渐成熟。有些领域的发展水平已经满足了实际需求,例如人脸识别与指纹识别。而有些领域的发展水平还相对欠缺,例如人体姿态估计与行为识别。在人与机器人交互过程中,人体姿态是重要的信息来源,能很好地描述人体的运动姿态与动作,对理解人的行为有重要作用。而行为识别是更高语义的视觉任务,为机器人与人的交互提供决策依据,使机器人更好地为人类提供服务。为此,本文就针对3D人体姿态估计和基于人体骨架的行为识别的相关理论、技术及其在人-机器人交互上的应用展开研究。主要研究内容如下:提出了一种基于时空图注意力卷积网络的单目3D人体姿态估计方法。采用图注意力卷积网络编码人体骨架的运动学特征、对称关系和全局姿态语义,以重建出更合理的三维空间结构,利用时间卷积网络捕获姿态序列的时间依赖性,以生成更平滑的动作,并在结构设计上灵活地利用了时间卷积网络前向推理的特点。实验结果表明,提出的方法不仅有效缓解了3D人体姿态重建中存在的深度模糊性和自我遮挡的问题,还泛化近距离人机交互场景中的半身姿态估计,并在Human3.6M、Human Eva和MPI-INF-3DHP数据集上取得了良好的结果。提出了一种多骨架特征前期融合的在线行为识别方法。通过前期嵌入层融合四种类型的输入特征,提高模型应对不同场景的泛化能力,同时避免增加过大的计算量,并结合最大池化和层次图池化操作提取骨架空间的多语义信息。根据日常行为的数据特点设计有效的骨架序列选取方式,并制作了一个含有17个关节点的3D人体骨架数据集NTU120-GAST,以兼容本文提出的3D人体姿态估计方法实现在线的行为识别。实验结果表明,提出的方法在NTU60和NTU120数据集上取得了较高识别准确率的同时需要更少的浮点计算量,能够有效地用于在线识别。构建了一个由数据采集、行人检测与跟踪、姿态估计和行为识别等四个功能模块组成的人体姿态估计与行为识别系统,整合了上述提出的算法。该系统能够实现实时可视化3D人体姿态重建的渲染效果,同时基于人体骨架数据实现在线的单人动作识别和双人交互行为识别。
其他文献
随着党的十九大报告提出乡村振兴战略,“乡村”成为了中国学术界一门重要的课题。中国乡村建设如火如荼政府、建筑师、各类社会组织纷纷将目光投向乡村。有关乡村设计的项目通过不同组织在各个地区持续进行着,村落内部的古建筑遗存因其显现的文物价值受到社会各界的关注。而在中国南方村落的四周,搭建在基塘之中的茅寮这一建造形式,作为渔民在基塘地区日常生产生活所用的棚屋,不但不受关注与保护,反而被判定为乡村建设中的累赘
随着集成电路技术的不断发展,微电子封装技术也朝着微小化、高密度和高复杂度发展,封装器件结构越来越复杂,随之产生的可靠性问题也日益凸显。其中芯片贴装一般采用基板+互连材料+芯片的结构,互连材料与基板的界面结合强度直接影响电子元器件的服役性能。为提高其界面结合强度,对基板表面进行修饰是一个可行性方案。本文以铝基板与环氧树脂界面粘接强度为基础,利用激光加工微槽对铝基板表面进行修饰,探索激光加工参数对铝基
金属增材制造是最先进和最具发展前景的增材制造技术,是未来科技和产业发展的重要方向。增材制造件的成形工艺特点使其面临着孔洞、开裂和分层等致命的问题,严重影响着结构性能。当前,使用超声等无损检测工具,检测并定位定量缺陷的状态,逐步成为热门的研究方向。激光超声检测技术具有非接触、频带范围大、检测精度高等优点,成为检测增材制造件微小缺陷的有力工具。因此,本文对不锈钢增材制造件表面缺陷和内部缺陷进行了激光超
极片是锂电池的关键组成部分,极片的质量状况不仅会影响锂电池的使用性能,还会影响到锂电池的安全性能。在卷绕式锂电池的制作中,涂布、卷绕等工艺过程容易引起极片末梢褶皱变形和正负极片错位等问题的发生,这些缺陷可能会导致电池容量降低,电池内部短路,甚至会引发严重的爆炸事故。X射线检测是工业中常用的无损检测方式,它能帮助获取电池电芯的内部影像,对电池极片的缺陷检测提供了一个有效的手段。本文以方形卷绕式锂电池
《红楼梦》通过对传统下凡历劫母题的完美继承与卓越创造,使小说有了更为深广的思想内涵和震撼人心的悲剧力量。这个更为深广的思想内涵和震撼人心的悲剧力量,就是《红楼梦》及其下凡历劫母题对人类生命存在的哲理思考与终极关照。具体表现在:一、《红楼梦》及其下凡历劫母题中的三大神话追问人生本源、思考人生价值、领悟人生哲理。二、《红楼梦》的其他描写,表现世间万物千变万化,揭示人生运动规律,思考社会人生,揭示人类生
虚拟实验平台是借助于多媒体、仿真和虚拟现实(Virtual reality,VR)等技术,在计算机上营造可辅助、部分替代甚至全部替代传统实验各操作环节的相关软硬件操作环境的软硬件相结合的人机互动平台。传统虚拟实验平台以视觉感知通道为主,使得其表现单一,同时,学生只能严格按照平台的固有步骤来操作,无法满足探究式的教学要求。另一方面,对虚拟实验有着强烈需求的教师没有具体开发能力,也没有足够经费请专业公
表面法线蕴含物体表面三维结构信息,在计算机视觉和计算机图形学等领域都有重要作用。偏振光与物体的表面形状存在着特定的光学关系,可由偏振信息估计表面法线。但偏振法线的计算存在着角度模糊性以及图像噪声等问题。角度模糊性是由于镜、漫反射模型的不确定以及天顶角、方位角的歧义性,而噪声带来的估计误差也难以避免。克服偏振法线角度模糊并提升法线估计的精度,是本文研究的核心。在总结前人工作的基础上,本文提出利用深度
城市公交车辆的运行状态在城市动态交通环境下受社会车流、公交乘客、路口行人、信号灯等各交通组成部分的影响,在时间与空间维度均表现出极强的随机性。因此在在实际的公交运行调度管理中,使用更科学有效的预测方法提升对未来运行状态不确定性的把控能力,是提升公交运行效率和稳定性、实现更精准可控的高质量公交服务的关键手段。从实际工程应用需求的角度分析,预测模型的部署需要从预测能力和计算效率两个方面综合衡量,并且预
患有神经源性膀胱的病人由于控制排尿的神经系统损伤,失去协调膀胱感觉、贮排尿的功能,无法意识到膀胱内尿液容量的多少,无法得知自身何时需要排尿,因过度注意自身膀胱尿液多少导致出现尿频、尿失禁等情况,引起过度紧张、尴尬、沮丧和社会孤立,极大影响病人的心理健康和生存质量。如何检测膀胱容量成为解决神经源性膀胱病人无法意识到膀胱内尿液容量等问题的研究热点。目前,膀胱容量检测技术主要有导尿管技术、计算机断层成像
双手爪攀爬机器人作为特种机器人,拥有串联式多自由度机构本体和交替切换抓夹基座的夹持器,在复杂杆件环境具有优异的运动、越障能力,是将来代替人工实现高空作业任务的理想工具。双手爪攀爬机器人为多刚体多关节机械系统。夹持器一端固定,另一端抓夹环境杆件时,由于抓夹位姿误差的存在,机器人与环境将形成过约束,无法可靠抓夹。抓夹过程中的微小位姿误差将导致机器人关节内力激增、刚性冲击、电机发热和能耗增加等问题。另外