基于关键点检测的手势估计

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:chenzeqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势估计算法作为人机交互中的核心技术,具有较高的研究意义和实用价值。近年来,基于深度学习的手势估计研究工作进展显著,但针对单张RGB图像的手势估计研究因图像分辨率低、深度信息缺失、自遮挡、视角及色彩变更等原因,实际表现不尽如人意。鉴于以上原因,本文以实现基于单目RGB图像的轻量化手势估计方案为研究目标,针对手势估计任务的高精度、高实时性的部署需求,分别实现了完整的2D和3D轻量化手势估计方案。具体来说,主要完成工作如下:(1)搭建了基于YOLOv3网络的手部检测器,针对手部检测任务调整了激活函数、损失函数及Anchor先验框,并基于COCO-TV Hand数据集训练出实用泛化性强的轻量化手部检测网络。(2)搭建了基于Re XNet网络的2D手势估计器,参考多任务学习理念拓展了手部判定功能,使其可以脱离检测器独自完成手势估计任务,并通过对比实验证明该Re XNet网络是当前估计器最合理的Backbone。为兼顾轻量化和多任务学习,该2D手势估计器被设计成直接回归的架构,实际测试表现良好,可以用于实际任务部署。(3)实现了2D热图-3D关节矢量图-3D坐标图的手势估计复合监督框架。在3D手势估计任务中,该架构能够有效缓解2D图像向3D坐标映射中存在的深度模糊性。本研究基于该复合监督架构,以Res Net50网络为Backbone搭建了轻量化的3D手势估计器,和同领域前沿研究工作相比,该3D估计器在保持运算速度大幅领先的同时,仍能保持较高的估计精度。特别的,在3D手势估计研究中,本文通过对比实验证实了上述复合监督框架和数据集混合训练的有效性,且最终训练的3D手势估计器在同领域泛用的RHD数据集上达到了与国际前沿研究相近的精度指标,并且具有显著的实时性优势。
其他文献
伴随着单细胞转录组测序技术的进步,我们对细胞的观察能力也在提高。相较于之前只能获取一组细胞基因表达均值的转录组测序技术,新的转录组测序技术能够获得单个细胞的全局基因表达谱。这有助于提高我们对细胞分化以及疾病发病过程的理解。然而,单细胞转录组测序数据具有高维、低密度的特点,使得分析单细胞基因表达谱数据仍然是一项具有挑战性的任务。因此,很多的降维方法被用于单细胞转录组测序数据的降维。但是这些降维算法是
学位
目的探讨安徽省某市三甲医院在新农合单病种付费执行五年来,理论上符合当地新农合单病种政策要求的病例但最终未执行单病种定额结算的影响因素。方法从当地的新型农村合作医疗系统了解有关单病种定额支付的所有相关政策,并且从所研究医院的病案信息系统,HIS系统获取从2014年8月到2019年7月5年间22092份满足单病种政策要求的病例的病人基本信息,病情信息以及诊疗信息,总花费以及自费金额、农合补偿金额等信息
学位
时间序列上的异常检测相关工作已经很成熟,但是这些研究并不能区分异常的种类。例如,在电压检测器中,电压突然发生的变化究竟是传感器传输时产生的噪声还是由于器件发生损坏造成的异常事件?之前的相关研究只有在一维时间序列上进行的,然而比起一维时间序列,多维时间序列数据在实际生产中更为普遍。本文提出了无监督和有监督相结合的异常检测流程框架CSUAD,它能够有效的进行多维时间序列上事件和噪声的区分。在这个CSU
学位
人工智能的决策过程需要大量的知识。哲学家柏拉图把知识定义为“Justified True Belief”,即知识需要满足三个核心要素:合理性(Justified)、真实性(True)和被相信(Believed)。知识图谱作为一种知识的载体,也需要满足合理性、真实性和被相信。但是目前的知识图谱,无论是开放式知识图谱还是传统知识图谱,它们都忽略了条件信息。例如,传统的知识图谱从“早期科学家认为地球是宇
学位
研究背景:乳腺癌是女性最常见的恶性肿瘤,中国乳腺癌的发病率逐年上升,并且与西方国家相比存在年轻化、分期晚的特点。Ras信号传导通路在细胞增殖、分化等重要生物学功能中发挥作用。Ras途径的异常活化是促使肿瘤发生发展的主要机制之一。G3BP1(Ras-GTPase-activating protein SH3 domain-binding protein 1)是Ras活性的负反馈调节因子-Ras GT
学位
背景增生性瘢痕(Hyperplastic scar,HS)是人类所特有的皮肤异常疾病,其特征是继发于创伤或手术损伤,真皮或皮下组织中胶原过度沉积。它通常是在伤口感染、过度紧张的闭合伤口或其他创伤性皮肤损伤后4至8周内出现。具有长达6个月的快速生长期,然后在几年内逐渐消退,最终导致没有进一步症状的扁平瘢痕。近年来,多磺酸粘多糖乳膏因其价格便宜、使用方法较简单,被皮肤科医生逐渐用来预防和抑制增生性瘢痕
学位
近年来,由于计算机算力的提升,机器学习及深度学习技术变得越来越成熟,逐渐渗透于各个行业。在医疗领域,深度学习算法已经被广泛部署在青光眼检测设备、脑电波检测机、X光图分析仪中。在医疗任务中,技术落地主要有两个难点,第一是人工标注成本昂贵,导致青光眼检测的眼底图像训练集的样本量较少,传统的数据增强方法已不足以满足任务的实际需要,会出现模型过拟合、鲁棒性不强等问题。第二是根据已有眼底知识,视杯视盘区域的
学位
飞行器制导控制系统是飞行器的灵魂,其性能直接影响飞行器的制导精度和制导过程的抗干扰能力,而飞行器制导控制系统的设计离不开飞行器制导控制仿真软件的帮助。本文来自于飞行器制导控制仿真软件研发和使用中遇到的软件可维护性差、拓展能力有限和兼容性差等实际工程问题。本文主要工作内容是设计和开发基于模型库的飞行器制导控制仿真软件,对软件的源代码保密,并对软件兼容性、软件拓展性和软件模块化等设计过程中遇到的一些关
学位
背景和目的:胶质瘤是脑肿瘤最常见的的恶性肿瘤,因其生长快速,呈浸润性生长,肿瘤边界不清,肉眼观像胶冻一样,故名胶质瘤;胶质瘤由于其生长方式和发展速度,手术不易完全切除,故治疗后易复发,化疗亦不能取得良好效果,总体生存率和预后较差,高级别胶质瘤的生存周期仅为十几个月。尽管在胶质瘤研究中投入了大量的人力物力,但有效的治疗手段仍是目前迫切所需。Ⅵ型胶原酶基因α2亚型(collagenⅥ-α2,COL6A
学位
背景和目的:恐惧记忆是神经生物学领域的研究热点,恐惧记忆是多个脑功能区共同协调完成的大脑活动,目前研究最清楚的是杏仁核。它又称杏仁体,位于大脑的边缘系统。是调节情绪、控制恐惧和记忆的脑部组织。研究发现,胆固醇代谢异常与恐惧记忆关[2]。因此,深入研究胆固醇代谢在动物恐惧记忆过程中的作用及其相关分子机制是本研究的主要目标之一。本研究使用胆固醇代谢障碍基因敲除小鼠模型(LSS+/-)非条件性杂合基因敲
学位