复杂场景人体活动语义细分化理解算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zengqz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于复杂场景的人体行为语义理解是近年具有挑战性的课题。复杂活动场景中的语义细分化理解中多数是围绕人体行为活动展开的,具体包括:对人体行为语义细分化理解、人体身份特征语义细分化理解和人体活动轨迹理解与分析。本文的研究内容主要针对以上的三个方面展开:(1)复杂场景下人体行为语义细分化理解。在复杂活动场景中,要在同一个场景中对存在的多个不同人体行为动作进行分析,由于多数视频标签都是针对单个行为活动进行标注的,对于存在多个体的场景缺少必要的标注。针对上述问题,本文提出利用人体关键点对人体活动区域进行定位,再对定位区域通过卷积神经网络进行建模,最终得出区域中的人体行为活动。在实际的视频场景中验证了方法的可行性。(2)复杂场景下人体身份语义的细分化理解。在复杂活动场景中,不仅对个体活动区域中的行为动作有理解的需求,而且对行为动作的发起者有语义理解的需求(即需要理解个体活动区域中的身份信息)。本文使用的人体生物特征是人脸信息,首先通过多卷积神经网络级联的方式在个体活动区域中检测出人脸的位置,考虑到在实际场景中人脸对摄像机的角度各不相同,需要将检测出的人脸利用仿射变换进行人脸校正,再将卷积神经网络作为人脸特征的特征提取器,最后通过提取到的人脸特征进行人脸识别工作,完成人体身份语义理解的任务。在公开数据集上和实际的视频场景中验证了方法的可行性。(3)复杂场景下人体活动轨迹理解与分析。在复杂活动场景中,要对特定感兴趣的行为语义进行后续行为语义的捕获和理解,并且在该区域缺少身份信息的情况下,则需要对人体活动轨迹进行跟踪。本文采用基于核化相关滤波器的跟踪方法,并在此基础上加入了多特征融合和多跟踪尺度变换的方法,使待跟踪区域的特征描述更具有全面性。在公开数据集上和实际的视频场景中验证了改进方法的可行性。综上,本文针对实际复杂活动场景的视频进行人体语义细分化理解,使用了多种特征描述算子,结合机器学习方法,并且通过实验验证上述研究在实际应用中的可行性。
其他文献
型钢混凝土框架柱作为重要的承载构件,越来越多的出现在抗震设防较高的地区,随之而来的就是型钢混凝土框架柱在地震中受到不同程度的损伤,考虑到财力、物力等因素,现实中不允
由于历史上粗放型的采矿和冶炼活动,石门雄黄矿区遗留了多处高度退化的重度砷(As)污染土壤,这对当地居民健康和生态安全造成了危害,因此,对此类土壤进行严格管控和生态恢复显
二氧化铅具有类似金属的良好导电性、化学稳定性好、析氧电位高,在水处理方面对有机污染物去除效果好,避免了铅基电极在使用中因腐蚀会产生大量铅离子导致水污染。采用电沉积
钢管混凝土柱异型节点在高层建筑和大跨工业厂房中得到越来越广泛的应用。但目前国内外钢管混凝土柱-钢梁框架节点的研究主要是针对常规节点,鲜有涉及不等高钢梁这类异型节点
商业模式创新是指企业为了更好的满足客户需求,重新整合企业内外部资源,重塑企业的商业系统结构,更新给客户创造价值的基本逻辑。本文在阐述M公司SSD产品商业模式如下主要问
在摩擦副表面加工合理的微织构能够有效提高摩擦副的润滑性能,但目前关于考虑空化效应条件下表面微织构对摩擦副润滑性能影响规律的研究存在不完善之处,理论和实验方面的研究
风沙灾害威胁着沙漠铁路的正常化运营,时常造成列车的缓行、停运,甚至出现脱轨和侧翻的高危险性事故,给国家和人民造成了极大损失,不便于地区之间经济、文化的相互交流。为减
在实际工程中,岩石被看成是一种内部含有大量损伤缺陷的非连续材料,这些缺陷会对岩石在外力干扰下的裂纹扩展、贯穿机理以及力学性质产生重大影响,导致岩体的强度降低、刚度
为了明确日光温室土壤氮磷负荷现状,本研究以黄土高原东部曲沃县磨盘岭设施蔬菜园区为对象,调研了设施蔬菜施肥现状,研究了不同种植年限设施菜地土壤剖面硝态氮、Olsen-P和氯
随着能源日益紧张,新能源并网及储能技术已成为未来能源战略的重要一环。我国风电总装机容量位居世界第一,但由于电网消纳能力受限,弃风严重,其中近30%的弃风电量是由调频问