基于深度学习的人体姿态估计

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gogoxincheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计和步态分析对骨科患者的康复管理有着非常重要的意义,例如卡伦(Computer Assisted Rehabilitation Environment,CAREN)系统可以通过多种传感器捕捉患者在进行康复训练时的三维姿态并完成步态分析,从而对步态进行评估并提出针对性的训练计划,对骨科患者的步行能力恢复有着非常重要的作用。但是,这种基于标记点的系统也存在着很多限制,例如需要人工标记关节点的位置,非常耗费时间,并且标记点会一定程度上干扰患者的运动姿态。而基于视觉的姿态估计方法有着成本低、速度快和不会干扰患者运动的优点,非常适合用于该任务。尽管目前各种基于视觉的二维和三维人体姿态估计方法都取得了很好的性能,但是它们在卡伦系统特定的环境下性能还是很有限。为了解决这些问题,本文提出了一种改进的网络框架,使用多视角视频输入为卡伦系统的康复患者进行精确的二维和三维姿态估计。首先,为了估计视频每帧中人体的二维姿态,本文提出了一种由粗到细的热力图内核收缩训练策略,在训练过程中逐渐减小关节点热力图的内核尺寸以逐渐精确定位关节点位置。其次,为了进一步获得三维姿态估计,本文提出了一种多视角和多时刻信息融合的时间和空间信息感知网络,其中多视角早期融合策略可以使用来自不同视角的信息弥补单视角下身体遮挡导致的信息缺失,多时刻后期融合利用来自输入视频序列上关节点间的时间相关性信息以获得更高的空间定位精度。基于本文收集的225名卡伦系统骨科患者步行运动数据集上的实验结果表明,采用由粗到细的热力图内核收缩训练策略进行二维人体姿态估计精度PCKh@0.5达到99.85%,而2DPE仅有5.30像素,相比于使用固定热力图内核尺寸的方法减少了14.5%。时间和空间信息感知的三维人体姿态估计网络预测的MPJPE为25.22 mm,而3DPCK达到98.71%的高精度,优于现有的基于单视点和多视点视频的三维姿态估计方法。结果表明,本文所提出的系统能够以较高的精度估计人体姿态,并能根据预测的人体姿态精确计算出各种步态特征,为患者提供精确的步态分析,本文的方法可以适用于临床应用中的步态分析。该研究为基于视觉的姿态估计系统的康复患者定量步态分析奠定了基础。
其他文献
智能制造的发展驱动了质量检测技术的高速演进,而芯片作为电子信息产业的关键产品,对智能化质量检测技术的工程需求迫切。其中,芯片表面标识的识别技术就具备较高的需求和应用价值。随着光学字符识别技术(Optical Character Recognition,OCR)逐渐深入工业领域,设计和实现适用于芯片相关制造场景的OCR方法,成为解决芯片标识识别问题的关键途径。当前,应用于产业中的芯片标识识别技术主要
神经形态计算凭借脉冲神经网络优良的生物可解释性和高能效比的优势而倍受关注,目前已有多款数字神经形态计算芯片问世。现阶段的数字神经形态计算硬件多采用一维神经元模型,一维神经元模型的生物细节表达能力却显不足。另有少数的神经形态计算硬件采用了二维神经元模型,但这些芯片所实现的二维神经元模型的硬件资源开销大且神经形态计算系统的可扩展性欠缺。本文在前人研究工作的基础上,针对以上问题,对数字神经形态计算硬件中
当今社会机器人变得越来越智能,相比人类具备更高的生产效率。因此,越来越多的行业开始启用机器人代替人工进行作业,所以机器人的智能化应用研究具备良好的前景。监所环境机器人是一种特殊的安防机器人,其可具备自主巡逻、自助充电、人数识别、异常报警等功能。理论上能够实现全天不间断巡逻,相比于人工具有情感等影响因素,机器人具备更高的可靠性。监所环境机器人运行于环境特征相似度大、特征较少的环境,其必须具备无人看管
移动机器人系统为了安全完成工作要求,最重要的任务之一,是通过传感器测量获取工作环境的知识,然后从这些测量中提取有意义的信息,这些信息是建立环境模型、明确自身位置的基础。传统的移动机器人观测模型基于理想的假设,如在基于视觉的感知方式中,通常假设环境噪声和测量噪声是各向同性、独立同分布的高斯噪声,无法全面地反映环境变化和传感器噪声等多源不确定性信息对感知过程的影响。为保证移动机器人在多源不确定性因素干
随着工业的发展,机器人的应用日益广泛,已成为推动生产自动化的主力军。分拣机器人作为机器人中的重要一员,是分拣和包装等领域的核心装备,需求量大面广。索并联机器人具有轻量化、高能效、成本低和高动态等优点,团队在前期研究中提出了一种具有平行索驱动结构的新型3平动自由度高速分拣机器人,并显现出巨大的性能优势和应用潜力。在分拣系统中,需要准确抓取物体,对机器人的精度提出了较高的要求。本文主要针对该平行索驱动
不稳定骨盆骨折多为高能量外力导致的伤害,随着建筑、制造、交通运输等各行各业的发展,骨盆骨折患者也有逐年增多的趋势。传统的治疗手术常采用切开复位内固定、闭合复位外固定支架手术法,这两种方法都有明显的缺点,前者手术时需要剥离大片软组织,有造成伤口感染、重要神经损伤的缺点,而后者适用范围窄、复位精度不高,同时手术对医生体力消耗极大,医护、患者都会频繁接触辐射,影响身体健康。机器人以其运动控制精准、抗疲劳
随着机器人技术的不断发展,机器人被广泛的应用到与人们生产生活息息相关的领域当中,并且发挥起了重要的作用。抓取是机器人在服务与工业领域中进行人机协调的重要能力,得到一个准确的抓取检测结果是机器人能否完成抓取任务的关键。但是,针对在未知场景中对随机物体进行抓取的需求,目前的抓取检测算法在准确性与实时性上都有待提高。为了解决上述问题,本文以抓取检测算法为研究对象,分别提出了基于锚框的抓取检测算法与基于关
鼻咽癌是指发生在鼻咽腔壁上的恶性肿瘤,经常出现在中国南部,东南亚,中东和北非。鼻咽癌的发现和治疗时间越早,治疗的成功率就越高,放射治疗是鼻咽癌最常用的治疗方法。在进行放疗时需要在医学图像中勾画出目标靶区以避免放疗损伤人体的健康区域。目前,勾画任务通常是由经验丰富的放射科医生通过对二维切片逐个手动勾画完成的,这不仅繁琐而且费时费力。而鼻咽癌目标靶区的自动分割方法能够提升这一过程的效率,减少医生的工作
多学科设计优化(Multidisciplinary Design Optimization,MDO)是一类处理涉及复杂学科的优化问题的有效策略。MDO方法旨在充分考虑工程系统各学科门类之间的异同,充分利用各学科之间的耦合效应,来获得全局的最优解。同时,由于现代工业和制造业中普遍存在着不确定性情况,因此在MDO过程中考虑不确定性因素的影响,定量的对不确定性因素进行分析,也是现代工程设计优化的研究热点
鼻咽癌(NPC)是中国,东南亚和中东/北非地区最常见的的头颈癌之一。从具有不确定性信息的计算机断层扫描(CT)图像中准确分割危险器官(OAR)对于有效规划NPC治疗的放射治疗至关重要。尽管卷积神经网络(CNN)在OAR的自动分割方面取得了最先进的性能,但现有方法并未为治疗计划提供分割结果的不确定性估计,并且其准确性仍然受到几个因素的限制,包括CT软组织对比度低,OAR尺寸高度不平衡以及切片间间距大