基于多模态数据的人体行为识别研究

被引量 : 0次 | 上传用户:bigger111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术的快速发展,人们对视频数据的分析和处理能力提出了新的挑战。人体行为识别通过对视频序列进行分析,提取相关的行为特征并识别出人体的行为类别,其在智能监控、无人驾驶和人机交互等方面有着非常广泛的应用前景。随着传感器技术的快速发展,数据可以通过多种模态来表示,如RGB、骨架、深度、红外、点云、音频、雷达和无线网络信号等。不同模态的数据在不同的应用场景具有不同的优势,不同模态的数据之间具有互补性和潜在的语义关联性,多模态人体行为识别的研究逐渐成为新的研究热点,如何有效地分析和利用不同模态的数据进行人体行为识别,成为近年来研究者们关注的焦点。本文对多模态人体行为识别的研究主要从三个方面展开:单模态特征提取,多模态特征融合和跨模态特征对齐。具体贡献包括以下四个部分:1.在手工设计特征的特征提取方面,针对深度数据和人体骨架数据,分别提出了一种特征提取算法。对于深度数据,为了捕捉到更具辨别力的人体运动特征,提出了一种多级帧选择采样算法,通过提取关键帧得到多个时序层次的样本,再计算多个视图的运动历史图和静态历史图。对于骨架数据,为提取更具表达力的多尺度时空特征,提出了一种时空特征提取算法,同时提取空间姿态特征和多尺度时间位移特征。另外,还研究了不同模态数据特征的融合策略,分析了采用两种不同的融合方式对识别结果的影响。通过在两个公开数据集的实验分析,与现有的研究结果相比,提出算法的识别效果有显著的改进。2.在自动特征提取方面,针对特征提取存在的时空特征尺度单一的问题,提出了一种多尺度自适应加权的图卷积神经网络,用于骨架数据的人体行为识别。首先将人体骨架关节点划分为多个部分,提取多尺度空间特征,然后设计了一种图顶点融合策略,可以自适应地学习潜在图拓扑,同时引入了多通道注意力机制和双流结构。在三个大型数据集上进行实验分析,提出的算法能有效提升识别性能。3.在多模态特征融合方面,针对如何提取不同模态数据之间的潜在语义特征问题,提出了一种基于双线性池化和注意力机制的特征融合网络。首先对RGB数据和骨架数据分别进行数据预处理,增强数据表达力,再使用特征提取网络分别获取数据的行为特征。使用提出的双线性池化和注意力机制网络有效地融合RGB和骨架数据的特征,得到更具表达力的融合特征。最后通过多层感知器来获得最终的行为分类。在三个公共数据集上的实验验证了该算法的有效性。4.在跨模态特征对齐方面,为降低不同模态数据之间的分布差异,提出了一种基于特征对齐的跨模态人体行为识别算法。在核流形对齐算法的基础上,引入了源域与目标域之间的分布距离,设计了一种解决优化问题的有效算法。将源域和目标域数据映射到一个具有类内差异低、域间分布距离小、类间差异大的特征子空间中。通过在两个公共数据集上的实验结果表明,本文提出的特征对齐算法能有效提升跨模态人体行为识别性能。
其他文献
目的:分析中药桃红四物汤加减熏蒸辅助治疗肋骨骨折的效果。方法:选取2021年1月-2022年1月梅州市中医医院收治的80例肋骨骨折患者作为研究对象,随机分为手术组和中医组,各40例。手术组采用常规手术治疗,中医组采用常规手术联合中药桃红四物汤加减熏蒸辅助治疗,对比两组临床疗效及各阶段的疼痛评分。结果:中医组治疗总有效率高于手术组,差异有统计学意义(P<0.05)。治疗后1 d,两组疼痛评分比较,差
期刊
随着政府推出的带量采购、网售、两票制等改革政策的实施,医药市场竞争变得更加激烈,优胜劣汰已经成为必然的趋势,这将对医药企业的发展能力和水平提出更高的要求。如何才能制定符合当今医药行业发展的市场营销策略,在同类产品中发挥竞争优势、抢占市场,是众多医药企业面临的首要问题。本文以仁心药业尩痹片市场营销策略研究为例,通过将市场营销的相关理论和仁心药业尩痹片市场营销的实际情况相结合,提出适合当下发展的营销策
学位
随着无线网络通信的不断发展,工作于非授权频段(Unlicensed Band)的无线网络将扮演着重要的业务承载和分流的角色,特别是非授权频段下的无线局域网(Wireless Local Area Network,WLAN)逐渐成为无线网络业务的重要承载方式。针对WLAN,近年来电气和电子工程师协会(Institute of Electrical and Electronics Engineers,
学位
高等教育的大众化和普及化之后,基于高等教育学习结果的评估成为世界各国关注的新焦点。本文首先对高等教育学习结果评估的概念进行了界定,然后分析了该评估提出的背景,接着以美国为例,介绍了美国基于高等教育学习结果评估的实践经验,主要包括评估的类型、对象、内容、过程等。最后总结了美国评估的特点及其对我国高等教育评估工作的启示。
期刊
金融科技是金融与技术深度结合的产物,是指利用先进的技术手段对传统金融行业的产品与服务进行创新,从而实现降低交易成本、提高效率、防范风险等目的的技术创新手段。在金融科技改革与数字化转型成为世界上各大商业银行重点发展目标的大背景下,我国也正大力推动商业银行的数字化建设。中国人民银行出台了以《金融科技发展规划(2022-2025年)》为代表的多项国家层面的发展规划,象征着我国商业银行的金融科技发展迈向了
学位
“科学实践”是对“科学探究”的继承与发展,自“科学实践”一词进入科学教育领域,引起了国际科学教育新变革。随着义务教育新课标的颁布,我国越来越重视学生物理学科核心素养的培养和学生实践。因此,本研究对“基于科学实践的单元实验教学对初中学生物理核心素养的发展是否有促进作用?”进行研究,分为理论探讨和实践研究两部分进行研究:理论探讨部分:通过阅读大量有关科学实践、单元教学研究的文献,探讨总结出基于科学实践
学位
通过查阅文献,总结道家和医家对“夹脊”位置的认知差异。医家认为夹脊的主要形式为“夹脊穴”;道家则以“夹脊关”呈现,聚焦关键部位。医家重点讨论距离脊柱的旁开尺寸,重点落在“夹”;道家则以“夹脊骨”和“夹脊三关”表达对人体后背中轴线的强调,重点落在“脊”。医家基于针刺等治疗目的,关注点最终走向体表;道家则通过内证将夹脊描绘为深入体内的、立体的结构空间。道家和医家对“夹脊”位置的认知差异,体现了二者对人
期刊
乙型肝炎病毒X蛋白(Hepatitis B virus X protein,HBx)在生成后即被快速降解,但目前影响HBx稳定性的机制仍未完全阐明。课题组前期通过酵母双杂交筛选与HBx具有相互作用的去泛素化酶(Deubiqutinases,DUBs),含MPN结构域蛋白(MPN domain containing protein,MPND)为筛选获得的蛋白之一。本研究首先采用免疫共沉淀和激光共聚焦
期刊
近年来,随着人工智能等技术的高速发展,机器人和人工智能的交叉使得机器人的发展进入了关键时期。机器人的应用领域不断拓展,从传统的工业场景向各行各业发展,得到了广泛的应用。实验室机器人、医疗机器人、物流机器人等也已经出现并逐渐进入人们的视野。无人实验室是一种智能化的实验室,能够自动完成实验室的各种操作和管理任务,提高实验数据的精度和实验结果的可靠性。作为无人实验室中的重要设备,机器人能够完成实验室中的
学位
目的 比较不同腹腔镜术式在食管癌治疗中的应用效果及其对患者围术期指标和远期预后的影响。方法 回顾性分析2016年6月至2019年6月在河南省南阳市中心医院接受腹腔镜手术治疗的99例食管癌患者临床资料,依据手术方法分为观察组50例(采用腹腔镜下经膈肌裂孔食管癌切除术)和对照组49例(采用胸腹腔镜下根治术)。记录比较两组的围术期指标、癌胚抗原(carcinoembryonic antigen,CEA)
期刊