基于深度图的实时部位识别和姿态估计技术与系统

来源 :浙江大学 | 被引量 : 0次 | 上传用户:w1141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实时姿态估计技术被广泛应用于体感交互、安全控制、医疗诊断等领域。深度图能直接反映拍摄场景的准确空间信息,大大降低了姿态估计的难度。但由于现有技术的封闭性,无法实现跨平台应用,特别是面向移动平台的开发。   本文实现了具有自主知识产权的基于深度图的姿态估计中间件平台。通过一种基于人体部位的姿态骨架表征作为中间过渡,将复杂的姿态估计问题转变为较简单的逐像素的目标识别问题,降低计算复杂度,取得实时性能和准确率的平衡。本文使用了简单的深度比较特征和有效的随机森林识别模型,用于逐像素标识人体部位;再通过基于部位识别结果的聚类获得感兴趣的几个骨架节点的三维位置。采用动作捕捉数据和计算机图形渲染技术合成训练样本,构建大规模、多样性的训练数据库。   针对交互应用在数据库中特别增加了更多的手部姿势,并从表面深度特征、动作时序特性等多方面优化了系统的实时性能。分别在合成和真实测试集上测试了系统的实时性能和准确度,并详细的测试与分析了识别模型各项训练参数的有效性。系统在普通PC平台的处理效率可达30~50fps左右,在Android平板电脑达到10~15fps左右,在合成测试集上的部位识别准确率达到70%~90%左右。系统在不同平台均表现出较高的准确率和实时性能,满足交互应用等的需求。
其他文献
集群系统(cluster)凭着其高可靠性、高可扩展性和高性价比等优势成为并行计算结构中最受欢迎的模型之一。其中曙光4000A和KD60平台是两种具有代表性的高性能集群系统。并行编
数据库系统是用来组织、存储和管理数据的仓库,它在企业、部门乃至个人的日常生产生活等诸多领域都得到了广泛的应用。随着现代互联网的迅速发展,信息呈现爆炸式增长,数据库
在数字图像的获取过程中,不可避免的要受到诸多因素的影响,导致图像质量达不到应用要求。由于受到硬件工艺的限制,如何采用软件的方法提高图像的分辨率受到很多研究者的注意。以
随着大规模互联网应用的高速发展,给存储系统的可扩展性提出了更高的要求,键值数据库由于其简单高效的数据模型在可扩展性方面较传统的数据库系统有很大的优势。另一方面,随
近年来,在计算机科学领域中,与本体相关的研究越来越多。科学家和学者已经构建了各种各样的本体,但尚未构建社会群体角色本体。本课题的研究内容就是如何构建社会群体角色本体。
大规模稀疏矩阵的求解是高性能计算中的一个常见问题,广泛存在于工程实践尤其是计算机仿真领域。用常规方法解稀疏矩阵时,会浪费大量的计算资源。目前,在国内外,在通用计算领域对
随着智能电网的发展,越来越多的新能源接入其中,如太阳能、风能等,形成分布式电网模式。然而,这些新能源的发电量易受光照、风速等自然条件的影响,尤其随着新能源接入量的增加,其本身的波动性对智能电网的稳定性带来很大影响。在电网稳定性状态评估和电网实时动态无功电压优化控制等方面,超短期负荷预测具有重要的参考意义。超短期负荷预测具有预测时间短、实时性要求高等特点,目前正处于研究阶段。智能电网中大量的时序数据
作为机械设备中最常见的零件之一,滚动轴承的工作状态直接决定了整台设备能否正常工作,甚至关系到整条生产线能否正常运行。滚动轴承诊断技术,可以及时的发现故障,避免造成重大事故,因此,进行轴承诊断的研究具有至关重要的现实意义。传统的信号处理方法常常忽略轴承信号中的重要信息,因此,利用传统故障诊断技术进行分析存在一定缺陷,出现误诊和漏诊现象比较频繁。而且随着科学技术的发展,对故障诊断的要求也越来越高,机器
随着电子信息技术及视频处理技术的发展,视频监控系统经历了纯模拟系统、部分数字化系统,完全数字化系统三个发展阶段。目前的视频的监控系统在完全数字化系统的基础上,借助
进入信息时代,人们可以利用信息技术实现信息的海量存储、高速传输以及快速处理,但信息的获取仍未达到理想的自动化水平。随着网络、传感器、无线通信、微机电等技术的发展进