基于多任务学习的人体行为识别算法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:ahhshpl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉和模式识别领域最重要的研究课题之一。它具有极高的商业价值和广泛的应用前景,如人机交互、智能视频监控、智能视频检索、智能驾驶等。绝大多数现有的人体行为识别方法主要将研究对象局限于可控环境下录制的视频。然而由于摄像机运动、背景遮挡、视角变化和光照变化等因素的影响,这些方法很难处理拍摄于真实环境下的视频,从而无法满足实际需求,因此,开展人体行为识别的研究具有极其重要的现实意义。目前,人体行为识别的分类方法多为单任务学习,即将行为类别视为独立的任务,为每一个行为类别训练单独的分类器,这种方法的缺陷在于忽略了行为类别之间的内在联系。在现实生活中,行为类别之间往往具有一定的相关性,于是本文将机器学习中的多任务学习方法应用于人体行为识别中。多任务学习可以通过同时学习多个任务之间的共享信息来有效地提高算法的性能。然而,由于某些行为类别之间的相关性相对较强,而某些行为类别之间的相关性相对较弱,因此将所有行为类别全部放在一起学习并不能使识别效果达到最好。本文在多任务学习的基础上加入了行为类别的分组信息,将强相关的行为类别分到同一组,弱相关的行为类别分到不同组,同时学习组内的共享信息和组间的差异信息,从而进一步提高人体行为识别的性能。主要研究内容如下:(1)改进的稠密轨迹特征提取。首先对视频进行预处理,消除摄像机运动产生的影响,然后对视频帧进行多尺度的稠密采样,并对特征点跟踪得到轨迹,再用HOG,HOF和MBH作为局部描述符来描述轨迹特征。最后针对不同的视频中提取到的轨迹数目不一致的问题,采用Fisher向量将不同数目的轨迹特征编码成固定长度的向量,并将其作为视频表征的特征向量。(2)行为类别预分组。由于Fisher向量是由高斯混合模型构建而成,考虑到不同行为类别拥有的高斯分布不一样,因此利用互信息来衡量高斯分布和行为类别的关系,并根据行为类别之间拥有相同的高斯分布越多越相似的原则,计算出行为类别的相似程度,最后使用近邻传播聚类算法将强相关的行为类别分到同一组,弱相关的行为类别分到不同组,得到分组信息。(3)基于分组信息的多任务学习。将每一个行为类别视为一个任务,先在强相关行为类别的组内进行多任务学习,共享组内信息,再对所有行为类别进行多任务学习,学习组间行为类别的差异信息。该方法既考虑到行为类别之间的关联,又考虑到行为类别之间的差异,为提升人体行为识别的性能提供了保障。为了验证本文算法的有效性,我们分别在HMDB51和UCF50数据集上进行验证,实验结果表明,本文提出的算法对人体行为识别具有较好的性能。
其他文献
肝脏是人体内最大的实质性腺体器官,其基本功能包括代谢功能(蛋白、糖、脂、胆汁酸、胆红素、激素灭活及部分金属)、生物转化功能(氧化、还原、水解、结合)、分泌和排泄功能(胆汁途
菌糠是食用菌产业的副产物,是典型的农业废弃物。随着食用菌产业的不断发展,越来越多的菌糠将会随之产生。菌糠传统的处理方法是就地堆放和焚烧,就地堆放会占用大量的土地,造
往复压缩机结构复杂,激励源较多,振动信号表现为较强的非线性和非平稳性,对其进行故障特征提取较为困难,目前还缺乏成熟的诊断方法,针对这种状况,本文提出了基于图像识别的智
【摘 要】阅读是语文教学不可缺少的一部分,它与学生的理解、写作和各种综合能力的欣赏密切相关。因而,在语文阅读教学中,提高教学效率成为当前亟待解决的问题。翻转课堂,顾名思义,就是以学生为主体,能够有效解决这一重大问题的教学方法。翻转教室可以活跃课堂气氛,引导学生独立思考,拓展思维,组织全班同学都参加讨论,所以,可以使学生在自我学习和研究中,培养他们的分析能力并且逐渐了解,拓宽学生思维的维度,它有利于
【摘 要】在当今世界,随着社会不断发展,以及国家对意识形态领域主导权和话语权日益重视,大学生思想政治教育已经成为高校教育中极其重要的一项内容。然而,思想政治教育由于理论性太强,教学过程一般较为枯燥,学生学习动力和学习效果一向不佳。案例教学法作为一项成效显著的教学方法,近年来在高校思想政治教育中得到日益广泛的应用,积累了大量的经验。本文以实际工作中的经验为基础,分析了案例教学法的特点、优势和使用方法
<正>答题注意事项:(1)请认真阅读本刊农村中医适宜技术专栏第1、3、5、7、9期全部内容,再行答题。(2)本次考试试题分两种:判断题只有一个正确答案,其他为干扰答案;多选题在备
期刊
心力衰竭(心衰)是各种严重心脏病终末阶段所表现出来的一种临床综合征,缺血性心衰最常见,当前除了药物治疗、介入治疗外,没有很好的根治方法。近年临床研究[1]表明,干细胞移植
随着轨迹数据的不断积累,城市中人群移动模式的研究逐渐成为了近年来的热点问题。它对于城市规划、土地利用、城市交通管理等领域有着非常重要的应用价值。城市中人群移动模式研究主要包括城市功能区识别和人群移动模式分析两大部分。城市功能区分区方法和城市功能区语义功能识别是功城市能区识别中的重要组成部分。传统的城市功能区分区方法并没有考虑“兴趣点”(Point of Interest,简称POI)在城市中的空间
【摘 要】作文教学是语文教学的一项重要任务,也是小学阶段的教学难点。如今,老师总觉得很难调动学生的写作积极性,学生一听说要写作文就头疼,学生怕写作文,而老师们怕改作文,因为改作文耗时长、收效低。为此,笔者从改进作文批改方式着手,寻求能调动学生写作积极性的作文批改形式,进而提高作文教学质量。  【关键词】师生共评;写作热情  【中图分类号】G633.3 【文献标识码】A 【文章编号】
【摘 要】新课标改革对小学语文教学质量与教学效率提出了更高要求,强调将培养小学生自主探究精神作为教学重点,为学生日后语文学习积累更多经验。基于此,本文对新课标下小学语文自主探究阅读教学的策略进行相关概述,旨在切实提升小学语文阅读教学水平,增强学生自身语文核心素养。  【关键词】新课标;小学语文;自主探究阅读教学  【中图分类号】G623 【文献标识码】A  【文章编号】2095-3089(2019