多模态人体动作识别研究

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:zhangyi89521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域的一个研究热点,具有广泛的应用领域,包括生物识别、智能监视和人机交互等领域。在基于视觉的人体动作识别中,主要输入的模态为RGB、深度图像和骨骼数据。每一种模态都能捕捉到某种信息,这种信息很可能与其他模态互补,例如,一些模态捕获全局信息,而其他模态捕获动作的局部细节。直观的说,将多种模态数据进行融合,可以提高识别准确率。此外,如何正确地建模和利用时空信息是人体动作识别面临的挑战之一。为了应对该挑战和充分利用不同模态的优势,本文将对多模态数据融合的人体动作识别方法进行研究,具体研究如下:传统的深度运动图(Depth Motion Maps,DMMs)损失了时间信息,传统的傅里叶时间金字塔(Fourier Temporal Pyramid,FTP)没有包含足够的空间信息,而且没有捕捉足够的运动细节。为了解决这个问题,本文提出一种基于深度运动图和傅里叶时间金字塔的人体动作识别算法,利用深度运动图很好的动作外观区分性和时间金字塔对时间建模的优势将整体人体动作过程中的时空信息互补。针对深度图像,利用局部二值模式(Local Binary Patterns,LBP)特征描述子提取特征。针对骨架序列,先提取利用节点间向量差的静态特征和动态特征,捕获更多的运动信息,然后提取FTP特征。最后利用支持向量机(Support Vector Machines,SVM)并且融合多模态数据进行人体动作的识别。在公开数据集的实验结果表明,该方法与现有的几种方法相比,取得更高的人体动作识别准确率。本文还提出了一种基于卷积神经网络(Convolutional Neural Networks,CNN)的融合深度和骨骼模态的人体动作识别框架。针对深度图像,为了解决了传统深度运动图损失时间信息的缺点,提出了一种自适应多尺度深度运动图(Adaptive Multiscale Depth Motion Maps,AM-DMMs)来捕获形状、运动线索。此外,自适应时间窗口确保AM-DMMs对运动速度变化具有鲁棒性。针对骨架序列,为了捕获骨架序列运动过程中的时空信息,提出了一种简洁有效的方法将每个骨架序列编码成三张包含时空信息的图,即稳定关节距离图(Stable Joint Distance Maps,SJDMs),每个图描述了节点间不同空间关系。最后,一个多通道的CNN用来从颜色编码后的AM-DMMs和SJDMs中提取有区分性的特征进行有效的人体动作识别。在公开数据集的实验结果表明,该方法与现有的几种方法相比,取得更高的人体动作识别准确率。
其他文献
针对大气气溶胶监测的迫切需要,研制完成了用于大气气溶胶和云的结构与光学特性研究的微脉冲激光雷达系统。主要介绍了该激光雷达系统的结构和主要技术参数,发射系统采用重复
“上火”了怎么用药?春天和夏天容易“上火”,日常生活中,我们发现很多人都在通过各种食物或药物清火,那么问题来了,“上火”了就一定要“清火”吗?听听北京世纪坛医院药剂师的分析
报纸
随着"互联网+"行动计划及11项相关顶层设计的出台,传统诉讼和传统仲裁根本无力应对这一局面,只有顺应社会发展,积极大力发展"互联网+争端解决方式",也即以网上仲裁为核心的网
目的研究水污染控制系统中微生物聚集体形态对多重耐药质粒接合转移的影响,为控制耐药基因在水环境中的传播提供科学依据。方法向运行稳定的颗粒污泥序批式反应器(granular s
社会发展瞬息万变,胎儿遭受不法侵害的情况层出不穷,给我国现有的民事司法制度带来极大挑战。《民法总则》以概括立法模式保护胎儿在遗产继承、接受赠与等事项上的民事权利。
目的:研究个体化心理干预联合中药内服外洗方对(伴随负性焦虑情绪改变)下肢静脉溃疡患者溃疡创面面积、溃疡愈合时间、溃疡愈合率、溃疡愈合总有效率的相关影响以及患者治疗
信息化社会在改变人类的生活方式与工作习惯的同时,也对传统的住宅提出了挑战。为了适应信息时代的要求,为了发展新经济,住宅的智能化是历史的必然。笔者通过参考大量关于智
蔬菜贮藏保鲜既是促进蔬菜生产加工的重要环节,也是提高广大菜农收入的重要途径。与发达国家相比,目前我国蔬菜贮藏保鲜业发展缓慢,蔬菜保鲜成本高,设备和人力资源投资大,这
<正>子宫输卵管造影术是诊断输卵管阻塞的有效方法,可以直观地观察到子宫的形态,输卵管是否阻塞、阻塞部位、管腔形态、输卵管的走形等〔1〕。某医院采用动态数字化子宫输卵