结合多模态信息的行为识别研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liangjb82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展以及可穿戴设备的广泛使用,人们越来越多地使用视频作为记录媒体,由于人体行为识别在现实生活中应用广泛,越来越多的研究着力于视频的人体行为分析。随着深度神经网络的快速发展,大量基于深度学习的视频行为识别模型被提出并且取得了优良的性能,但现存的这些算法仍存在两个主要的问题,一是对多模态信息的利用不充分,例如只使用单模态的数据,或者没有同时同步训练多模态数据。二是没有完全挖掘多精度信息。本文针对上述存在的问题对视频行为识别任务进行研究,分别提出了基于多模态信息融合和基于多级特征的行为识别模型,本文的研究内容主要包括下面两个部分:(1)多模态信息的利用。当前许多视频行为识别模型只使用单模态的数据,或者在使用多模态数据时分别训练针对单模态的网络,没有充分利用数据中包含的多模态信息的互补性和关联性,所以本文提出了多模态特征融合模块,该模块将每个模态分别映射到共享的和特定的特征空间,然后根据两个模态在共享特征空间中的相似性,对特定特征空间中的特征进行增强。融合后的特征不仅结合了两种模态的特性,而且显式地增强了模态间的不变性。本文进行了充足的比较实验以及消融实验,实验结果证明了所提模型与其他模型相比具有出色的识别能力。(2)多精度信息的挖掘。在视频行为识别任务中,因为动作片段的持续时间不同,所以模型需要拥有对长时间事件和短时间事件都能精确理解的能力。当前很多模型只建立了单一级别的特征,没有显式建模多精度的信息。针对此问题,本文提出了基于多级特征的模型,通过不同程度的特征聚合,显式地构建不同级别的特征以表示不同精度的信息,然后使用对应的子网络处理不同级别的特征,最后聚合所有子网络的输出得到模型的预测。本文进行了完整的比较实验,结果表明多级特征的使用相比于单级特征能够显著地提高模型的性能。
其他文献
石英晶体微天平(QCM)自诞生以来,因其具备高灵敏度和高精度的特性而受到人们的广泛关注。目前对QCM的检测主要通过振荡电路来实现,该实现方法的电路结构简单、成本低廉,常被应用于各种QCM应用研究中,但在大阻尼液体中常会发生停振现象。为了避免对测量结果的较大影响,在大阻尼情况下可使用实验室网络分析仪测量,但又存在体积大、成本高昂等缺点。因此,本文提出了一种基于扫频法的无源测试方法,根据该方法设计了Q
学位
近年来,随着互联网技术的迅猛发展,大量的专业领域知识通过各种方式涌入到互联网中,用户如何从中获取有效信息也变得越来越具有挑战性。问答系统通过语义信息分析用户问题,做出更简洁的回答,渐渐变成信息检索的新方式。本文以医疗领域为例,分析构建领域问答系统的相关技术,并且深入研究知识抽取和语义解析方面的技术,对模型和算法进行了改良,最终构建出基于知识图谱的医疗问答系统。本文主要研究工作包括以下几个方面:(1
学位
随着互联网数据的指数级增长,大数据技术得到蓬勃发展。大量数据由不同实体之间的关联和交互产生,非常适合用图数据结构建模,即将实体信息存储为顶点,将实体之间的交互信息存储为边。图挖掘技术通过分析图的拓扑结构来研究数据之间的关联性,而用于发现图中特定子图结构的图模式挖掘是其中的关键任务。图数据集规模日趋庞大,很多应用对实时响应的要求也越来越高,传统模式挖掘的时延变得无法接受。研究者逐渐在模式挖掘的实践中
学位
“家”是人们生活环境中最重要的场所。随着2020年“新冠疫情”爆发,人们对居所的温度湿度、空气质量、饮水安全等都有更高的期待。舒适家居行业从2000年初进入中国市场以来,已经发展了20多年,顾客的需求也随着行业的发展变得更加多样化和个性化。一些舒适家居企业面对顾客需求的变化,也开始尝试各种转型之路。本文以S暖通公司为研究对象,通过企业内部调研和近年的经营数据,整理和分析出该企业目前面临的主要经营问
学位
随着大数据、云计算、物联网等信息技术的飞速发展和广泛应用,信息技术已经融入到企业的生产经营、人们的生活学习,信息化已融入经济社会各领域。智慧城市是城市信息化发展的主要体现,是推动城市治理体系和治理能力现代化的必由之路,其信息安全问题也备受关注。开展并完善智慧城市信息安全风险评估机制是保障信息安全的关键手段,通过信息安全风险评估,有助于智慧城市管理决策者把握智慧城市信息安全状况。而现有的信息风险评估
学位
空间光学系统在地球静止轨道上工作时,其杂散光抑制水平的高低决定了空间光学系统的探测性能。为了保证探测系统的正常运行,并发挥出传感器测量的精度,进而满足日益增长的高质量图像信息需求,以基于光线追迹程序的空间望远系统的杂散光抑制作为研究课题。针对地球静止轨道上可见光波段的主要杂散光来源都进行了相关研究,确定地气光作为最主要的杂散光源。根据探测指标,计算得到杂散光的抑制要求。根据具体的设计需求,通过对比
学位
文化经济学是指研究和探讨作为社群价值系统的文化与作为财富价值系统的经济之间的内生关系及其转换机制的知识体系。在经济价值考量成为发展主导评价的潮流中,中国的文化经济学研究范式需要设定基于文化价值的新坐标,适应并还原中国语境,中国的文化与经济问题也亟待内生的文化经济学的有效作为。作为新兴经济业态的文化产业要能够符合中国国情和利益的文化规范与经济模式,健全现代文化产业体系与文化市场体系,需要以文化价值系
期刊
可重构智能超表面(Reconfigurable Intelligent Surface,RIS),也称为智能反射超表面(Intelligent Reflecting Surface,IRS),可通过灵活地调整其反射元件的相移系数来重构电磁传播环境,有望成为未来第六代移动通信(The 6th Generation,6G)系统中提升能效、改善覆盖、及增强用户体验的关键技术。为了充分挖掘与利用RIS辅助
学位
近年来,我国大力提倡发展绿色建筑,预制装配式住宅作为绿色建筑的一大趋势被提出,然而高昂的建造成本制约了装配式建筑的快速发展,成为阻碍推广预制装配式建筑发展的主要因素。目前装配式建筑的发展正处于扁平状态,打破预制装配式建造高成本瓶颈,快速改变装配式建造模式,是现阶段业界普遍追求的目标。本文在EPC总承包模式下对各建造阶段影响装配式住宅建造成本的因素进行全面识别、判断、对比、分析的基础上,识别装配式建
学位
模数转换器(Analog To Digital Converter,ADC)作为模拟信号向数字信号转换的必要器件,在航天、精密测量、无线通讯等多个领域有着重要的作用。由于实际应用的需要,ADC的性能也在不断的提升。高精度ADC使用传统的测试方法及设备测试时存在的测试时间过长、测试信号纯度要求高等问题。因此,根据高精度ADC的特点研究高精度ADC的测试方法具有重要的意义。本课题主要研究内容如下:(1
学位