基于深度学习的人体动作识别方法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:mingge911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域的重要研究方向,在智能安防、人机交互、智能医疗、视频检索等多个领域中有重要的应用价值。随着深度学习的发展和大数据时代的到来,人体动作识别迎来了新的机遇。人体动作识别方法由传统的基于手动筛选特征的方法过渡到当前以深度学习为基础的端到端的方法。本文重点研究基于双流深度神经网络的人体动作识别方法,主要工作包括:第一,提出一种基于ResNeXt的双流网络模型人体动作识别方法。为了进一步提高目前常用的基于VGGNet、Inception或ResNet等双流网络模型的动作识别精度,本文提出使用新型ResNeXt网络结构代替原有的各种卷积神经网络结构,构建双流网络模型用于视频数据中人体动作识别。首先,为了提取更丰富的时空特征,本文使用RGB和光流两种模态的数据,使模型能将视频中的动作外观和时序信息互补对动作进行识别。其次,本文将端到端的视频时间分割网络(TSN)的思想应用于所提出的Res Ne Xt网络模型,通过将视频分为K段实现对视频序列的长范围时间结构建模,并通过测试得到最优视频分段值K,使模型能更好的区分存在子动作共享现象的相似动作,解决某些由于子动作相似而发生的误判问题。此外,我们应用数据增强方法,增加样本的多样性,令网络泛化性更强,更具鲁棒性。在UCF101和HMDB51数据集上的实验测试结果表明所提方法的动作识别准确率优于目前文献中主流动作识别模型和方法的性能。第二,提出一种基于运动能量引导视频分割抽取的多模态双流网络模型人体动作识别方法。为了充分利用多种传感器获取的动作信息,并更有效地实现视频输入帧选取,从而提高模型的识别能力,本文利用多模态数据信息对TSN模型算法进行改进,提出一种基于运动能量引导进行视频分割和抽取的方法,利用从深度数据中捕获运动能量信息作为指导视频帧时间采样的依据,将采样得到的视频帧送入ResNeXt网络进行分类识别。此外,所构建的双流网络模型同时使用深度和RGB两种传感器获得的多模态信息作为模型的输入,并使用自适应多流融合方法有效融合两个模态数据的信息,形成最终的动作分类结果。在NTU RGB+D数据集上的实验测试结果表明了所提算法的有效性。
其他文献
中国学生发展核心素养以“全面发展的人”为核心,指学生应具备的、能够适应终身发展和社会发展需要的必备品格和关键能力。核心素养的落实与学科教学息息相关。生物学科的内容就是研究生命现象及规律,生物学科核心素养把“生命观念”摆在首位,这凸显了生物科学与众不同的育人价值。生命观念比较抽象,犹如“空中楼阁”,在日常教学过程中急需落地,结构与功能观是生命观念中最基本的观点之一,包括“结构观”“功能观”“结构与功
在我国多发自然灾害和事故灾难的情况下,为了保证救援人员的人身安全,发展远程无人操作平台是面向应急救灾安全保障的新需求。为了向操作员提供准确的远程环境感知能力,基于
《专利法》第四次修改之际,立法者借鉴美国的做法在《中华人民共和国专利法修订草案(送审稿)》第六十八条第一款规定了惩罚性赔偿制度。2018年12月5日,国务院常务会议审议并通过的《专利法修订草案(送审稿)》明确规定了惩罚性赔偿。依其规定:对于主观“故意”侵犯专利权的行为,人民法院可以判决其支付惩罚性赔偿金。我国专利法将惩罚性赔偿的适用门槛限于“故意”。专利侵权惩罚性赔偿针对的是侵权者的主观状态。“实
目的通过观察血源性单核巨噬细胞(monocyte derived macrophage,Mo-Mφ)对体外循环(cardiopulmonary bypass,CPB)大鼠术后认知功能障碍(postoperative cognitive dysfunction,POCD)的影响,探讨此细胞作用机制以及是如何发挥脑保护作用的。方法清洁级健康成年SD大鼠,雄性,40只,体重350400g,由中国人民解放
《老残游记》是晚清时期中国古典小说的代表作之一,在国内小说创作环境与域外小说引入的共同作用下,《老残游记》的叙事艺术展现出自身的独特之处。本文对《老残游记》叙事艺术展开研究,包括绪论和三个章节,共四部分。在绪论部分,主要是对刘鹗生平、《老残游记》的成书及版本、刘鹗及《老残游记》研究现状等三方面进行梳理。第一章主要从叙事结构、叙事语言和叙事声音三方面讨论了《老残游记》叙事艺术的特色。《老残游记》的叙
地面网络与云计算协同所构成的“云-管-端”架构,在过去这些年取得了巨大的成功,极大地推动了社会的发展与进步。然而,随着近些年,人工智能、物联网、虚拟/增强现实等技术的迅速发展,涌现了大量分布或活动范围广、时延和可靠性性能要求高的新兴业务,如智能交通、工业物联网、应急救援、智能战场等,传统的以地面网络和云计算为核心的“云-管-端”架构由于其有限的覆盖范围、较高的传输时延、中心式的工作方式,导致无法满
岩藻糖(Fucose)是一种重要的脱氧己糖,在植物中能调节纤维素微纤维和木葡聚糖的相互作用从而影响细胞壁的机械性能。GDP-岩藻糖(GDP-fucose)是形成岩藻糖基化聚糖的重要供体,通过从头起源(denovopathway)和补救途径(salvagepathway)合成。在大多数生物中,需要岩藻糖激酶和GDP岩藻糖焦磷酸化酶催化生成GDP-岩藻糖。但是在细菌和植物中,仅需要岩藻糖激酶/GDP岩
蒲公英甾醇是从蒲公英中分离得到的一种五环三萜类化合物,其抗炎、抗氧化、抗肿瘤等生物学功能近几年来得到广泛关注。本试验通过建立对乙酰氨基酚(Acetaminophen,APAP)诱导的小鼠肝损伤模型来探究蒲公英甾醇对药物性肝损伤的保护作用及其机制,为蒲公英甾醇临床应用提供新的理论基础,同时对药物性肝损伤的治疗提供新思路。将8周龄雄性小鼠随机分为6组,即空白组、模型组(APAP组)、阳性对照组(联苯双
目的观察加味温胆汤治疗后循环缺血所致眩晕(痰浊中阻型)的有效性和作用机制,为今后中医药治疗后循环缺血性眩晕方案提供有益的参考。方法将符合本次课题纳入标准的60例患者按随机数字表随机分成对照组和治疗组,每组30例。对照组选用银杏达莫注射液20ml静脉滴注,每日一次;治疗组口服加味温胆汤,每日两次,每次200毫升;同时选用银杏达莫注射液20ml静脉滴注,每日一次。观察周期为14天。治疗前后进行脑彩超下
哈密是古代丝绸之路的要道,也是多种文化传播、交流和沉淀的历史文化遗产之地,这使哈密人民自古能歌善舞,喜诗会吟,每一个音符、每一组动律都渗透他们的血液中。在哈密艺术文化的历史长河中,哈密麦西热甫是哈密地区人民生活中独特的一种民俗活动,具有多种文化的撞击与交融的文化背景,蕴藏着丰厚的中华民族文化与民俗资源。而与这一文化空间不可分割的哈密民间舞蹈,在活动过程中作为一种“媒介”,不仅仅是娱乐活动和自身愉悦