基于零样本学习的人体行为识别算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:hhhanyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉领域的研究热点之一,具有重要的理论价值和应用前景。随着深度学习技术的发展,基于多样本(监督)学习的行为识别方法取得突破性进展。然而这种方法需要大量的标注样本,且无法扩展到样本量极少甚至零样本情况下的识别任务,导致模型的泛化能力受限。零样本学习可以将已知类别数据的知识迁移到对未知类别的预测,因此为解决上述问题提供了创新性的思路。目前,大多数零样本行为识别方法都是研究基于静态图片的目标识别问题,将此类方法直接应用于基于视频序列的零样本行为识别问题时会导致时序信息缺失、不能有效学习到复杂行为的视觉信息和类别语义的关联关系。针对这些问题,本文重点研究利用具有时序特性的视觉特征和具有语义相关性的语义表示来构建更有效的视觉到语义的映射关系,同时将单标签任务扩展到多标签行为识别。本文主要工作如下:(1)提出了一种基于时序建模和时空网络的零样本行为识别方法,该方法设计双流时空网络将视觉特征映射到语义嵌入空间,网络中的空间流和时间流分别对RGB和光流信息进行处理。通过卷积神经网络预先提取特征后利用循环神经网络对序列特征的上下文信息进行建模,充分获取到视频中的时间动态信息。最后将具有高层语义的时空特征进行融合来增强视觉嵌入的表征能力,提高了对未知行为类别的识别性能。(2)提出了一种基于联合空间和时空网络的零样本行为识别方法,该方法中采用联合(公共)空间来搭建视觉空间和语义空间的桥梁,将视频数据的视觉特征和标签的语义表示都嵌入到这个空间来学习视觉语义的对应关系。这种映射关系不仅能够建模视觉特征和语义表示各个维度的关系,而且同时优化视觉特征、语义表示以及类别标签的关联性,从而构建了更有效的视觉到语义的映射关系,进一步提高了零样本行为识别的准确率。(3)提出了一种基于联合空间和多标签学习的零样本行为识别方法,该方法将单标签任务扩展到对多标签行为数据的识别。针对多标签学习的复杂性,本文利用联合潜在嵌入学习方法为视觉特征和语义表示学习一个联合潜在空间,并通过将人类行为的视觉信息和语义表示分别映射为该空间中的视觉嵌入和语义嵌入以寻找对应关系。同时,在模型学习中交替训练视觉模型和语义模型并设计多损失函数优化来完成多标签零样本行为识别任务。
其他文献
枪械走私危害世界和平与国家安全。今年是我党和国家历史上具有特殊重要意义的一年,党的十九大即将召开,金砖国家领导人第九次会晤也于9月在厦门举办。然而,行邮渠道逃避海关
本文对中国地衣学在多样性、系统性及其物种与基因资源生物学研究方面进行了综述。文中强调了多样性和系统性研究在自然界地衣资源与研究开发之间的桥梁作用。论述了地衣结皮
地方治理在当代己经成为公共管理的一个新的发展方向,并且治理在本质上其实是地方性的,所以聚焦于地方成为治理的内在品质。中国的地方治理一直在发展当中,这其中会出现诸多
毛泽东诗词集中体现了中华民族以爱国主义为核心的伟大民族精神,把毛泽东诗词转化为"纲要"课教学资源是高校思想政治理论课教学改革的一种有效的路径选择。结合近两年来湖南
通过紧邻地铁的深基坑工程项目实际运用,论证了自动轴力伺服系统在深基坑开挖过程中的效果。工程选取了多个测斜点,对基坑施工过程中的围护结构深层水平位移实时监测数据进行
根据航磁测量资料,对四川盆地的磁场特征进行了分析,确定了盆地的边界及范围,并在编制四川盆地变质基底深度图、构造区划图的基础上,对盆地的基底结构、性质及其深度变化特点
介绍坡率法在广州街北高速公路SD3标K8+940~K9+080段左侧路堑高边坡设计中的应用,结合工点地形、地质,与土石方调配情况,将坡率法与锚杆框架梁加固进行比较是一种经济、合理的
明清时期江淮地区水旱灾害的频繁发生是多种复杂因素共同作用的结果。过渡性的地形、气候、水系造就了江淮地区脆弱的生态环境,自然孕灾机率本身就很高。不合理的经济开发活动
“十三五”时期,实现农村贫困人口整体脱贫仍然是我党重大而紧迫的任务。为提高脱贫攻坚成效,打赢这场脱贫攻坚硬仗,洛南县石坡镇党委和政府,面对自然条件差、贫困人口数量大
来华留学生的《中国近现代史》课程是来华留学生汉语与中华文化教育课程体系的有机组成部分,对留学生了解中国和理解中国有着非常重要的意义和价值。然而近年来,国内给留学生