基于人体骨架的行为识别算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xb_wonder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉领域的极具挑战性的问题,因其具有广阔的应用场景近年来受到了越来越多的关注。一般来说,人体行为可以通过多种方式识别,如外观、深度、光流和人体骨骼。在这些模式中,动态人体骨骼通常传达的信息较其他几类数据类型更专注于人体本身的运动特征。本文立足于视频数据中人体骨架信息,并根据实际使用场景,将整个论文工作分为视频骨架信息的提取和行为识别模型搭建两个研究问题。针对视频数据中人体骨架信息的有效提取任务,本文通过对现有人体姿态预估工具在实际场景中存在的问题进行梳理,设计了用于人体骨架提取的多目标跟踪算法。首先,为了解决骨架序列在逐帧处理过程中容易造成人物对象错误匹配的问题,提出了帧间骨架匹配算法(SOMA算法),力求保留骨架序列数据在时间维度上正确的特征信息。接着,本文提出根据相邻帧内关节点的空间位置来平滑关节点运动轨迹,用于消除姿态估计工具结果中存在的误差,提升数据空间位置上的精准程度。最后,为了削弱姿态估计工具的结果在不同分辨率视频中示数范围不同对后续行为识别结果的影响,设计了骨架信息的归一化单元模块,使得模型能够同时接受不同分辨率、不同拍摄视角以及不同人物占比(人物对象在视频画面中所占的比例)的数据。针对基于人体骨架的行为识别模型的搭建,本文在时空图卷积网络模型的基础上,提出了利用数据驱动模型调整关节点间连通关系的自适应时空图卷积网络。原有的时空图卷积网络模型对关节点间拓扑关联性的设置较为固定,降低或限制了深度学习网络对潜在未知信息特征的学习能力。因此本文针对性地提出自学习拓扑关系的自适应时空图卷积网络模型,尽可能的释放数据本身的驱动能力,充分发挥基于动态人体骨架的识别模型的学习能力。另一方面,为了提升整个算法模型在移动平台落地的可能性,本文利用知识蒸馏机制进行模型参数的瘦身,在尽可能保留原模型学习能力的前提下,降低模型参数个数,为将来方案在实时场景中的落地提供依据。最后,本文针对以上研究模块设计了相应的仿真实验,对方案的性能进行严谨的论证,结果表明,本文所涉及的相关方案在完成基本功能任务的同时,相较于其他模型还表现出较好的稳定度和收敛速度。
其他文献
在全球变暖的背景下,西南极和南极半岛是世界上增温最显著的区域,但是东南极地区(EA,30°W-150°E,66.5°-90°S)却未呈现出明显增温,1979-2014年南半球夏季(DJF)期间,更观测到东南极地区地表气温(SAT)呈递减趋势,而造成东南极降温的主要原因还不是很明确。之前研究强调了高纬度动力学和热带海温对南极地区SAT趋势的影响,而本研究基于观测和再分析资料的统计诊断以及数值模式敏感
本文首先利用1982-2016年的MSU/AMSU-A亮温资料,分析了青藏高原地区对流层上层温度的气候趋势及其演变特征,并利用ERA-Interim和NCEP-R2再分析资料的相应高度大气温度资料进行了对比分析。结果表明,青藏高原地区对流层高层亮温序列总体表现为逐渐增暖的趋势,这与再分析资料的对应层次大气温度变化有很好的相似性。基于集合经验模式分解方法(EEMD)的非线性趋势分析表明,青藏高原地区
目的自Sepsis 3.0提出qSOFA(快速序贯器官功能衰竭评估)作为脓毒症早期筛查指标以来,存在相应的质疑,本研究的目的是通过对急诊感染或疑似感染患者行qSOFA、SIRS评分,研究qSO
近年来,PPP模式在公共文化项目的应用增多,但风险也逐渐显现,如资金需求大,社会资本方可能通过“明股实债”让政府背上高息债务,加重了未来财政压力;由于项目经营性收入低,在建设期常常捆绑其他项目资源如土地进行融资,与现行政策抵触;由于项目付费主要依靠政府可行性缺口补助,容易出现政府财务状态不佳导致社会资本方投资难以回收等。本文以广西某文化广场PPP项目为对象,研究该项目建设及运营的风险识别、风险分担
声源定位作为阵列信号处理中的一个重要研究分支,被广泛地应用于各个领域,成为学者们研究的一大热点。在传统声源定位方法中,最具代表性是子空间类方法,然而子空间类算法存在分辨率低、抗噪性能弱等缺点。为了解决子空间类算法存在的问题,又由于空域信号自身具备稀疏性,因此稀疏重构算法被合理地应用于声源定位中。本文依据稀疏重构算法做了以下四个方面的工作:1.为验证稀疏重构算法在远场声源DOA估计中的突出优势,选取
宽带信号由于携带数据量较大以及频率信息丰富的特点成为阵列信号波达方向角(Direction of Arrival,DOA)估计的一个重要的研究领域,而对于均匀线型阵列(Uniform Linear Array,ULA)的理论研究成熟,ULA还有易于建模的特点,因此针对ULA的宽带信号DOA估计成为了近年来的一个研究热点。该论文针对远场宽带信号DOA估计开展了探索,可将主要贡献和创新归纳如下:(1)
近年来,过渡金属催化的偶联反应已经成为化学合成中的一个高效手段,在这个领域中,直接的C-H键的活化成为构建新的C-C键或者C-X键中最有效、最环保的方式之一。过去的几十年里,Rh催化的C-H键活化由于其多样性和Rh催化剂的广泛使用,使得它受到了广泛关注。Cp*Rh是一种应用广泛的催化剂,与其有关的研究已被大量报道。目前为充分发挥其价值,需要我们探索其他更多新的导向基团、新的偶联试剂、更为温和的反应
利用1980-2016年NCEP/NCAR全球大气再分析资料、NOAA_ERSST_V4逐月平均海表温度数据以及中国气象局国家气象信息中心提供的中国753站日最高温数据,基于百分位阈值法定义了华南夏季极端高温日数、强度指数,分析了华南夏季极端高温的年际、年代际变化特征及其与关键区海表温度的可能联系,并采用NCAR CAM5.1全球大气环流模式对关键区海表温度异常进行了数值试验,对比观测结果探讨了关
硫酸化氧化锆(简称为SZ)固体超强酸催化剂含有超强酸性,具有较高的催化活性,成为研究的热点。但是,传统的SZ比表面积偏小,孔道分布不够单一,这也就限制了它的潜在应用。本论文研究制备了两种有序介孔SO42-/ZrO2、S2O82-/ZrO2-SiO2和一种纳米S2O82-/ZrO2超强酸催化剂,并应用于煎炸废油的酯交换反应,具体的研究的内容如下:(1)采用正丙醇锆为原料,P123(EO20PO70E
隔震技术不断发展,可灵活运用于各类建筑中,但由于使用成本偏高、施工不便,使其难以在村镇或广大经济欠发达地区推广应用。针对上述不足,本文以提高村镇砌体房屋抗震能力为目标,提出一种新型简易隔震措施,该措施由十字卡槽式简易隔震支座与砂垫层共同组成。十字卡槽式简易隔震支座具有高性能、低造价、重量轻、易施工等优点;砂垫层则可简化隔震层施工,并在建筑遭遇往复地震作用时通过与楼层底板的滑移摩擦作用耗散地震能量。