基于深度学习的行为识别算法研究

来源 :河北建筑工程学院 | 被引量 : 0次 | 上传用户:skycat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别技术是视频分析和处理中的一项关键技术,在多领域具有潜在应用价值。早期将视频的单帧图像作为行为识别网络模型的输入数据,得到一个识别结果用以表征视频中的行为。然而对于视频来说一张图像中表达的信息只能代表该行为的一部分,不足以分辨整个行为。当该帧图像中的行为差异不明显,或者不包含特定行为信息,会导致分类效果较差。因此,图像序列随着时间变化的时序特征是影响行为识别结果的关键因素。以解决行为识别中时序建模困难的问题为出发点,深入研究了基于深度学习的行为识别算法,目的在于探索一个通用且有效的行为识别模型。主要研究内容如下:(1)提出了基于多路卷积网络的行为识别算法。时序信息的处理是行为识别的研究重点之一,不同的行为时序长短不一,而现有的算法输入长度固定,忽略了不同长度的时序特征。针对此问题,设计了一种多路卷积网络的行为识别网络框架。网络以不同尺度和模态的数据作为输入,整体分为三条网络分支,分别为短时序分支、长时序分支和光流分支,采用多路分支逐层提取不同尺度、不同模态的行为特征。为了发挥各种特征的优势,在网络的最后融合了不同特征信息,既能增强网络的时间表达能力,又能适应不同尺度的行为变化。在大型行为识别数据集UCF101上进行了验证,结果表明该算法克服了固定序列长度输入对不同长度行为判别力的不足,同时兼顾了多种模态特征的互补性,有效提高了网络的识别性能。(2)提出了结合注意力机制的三维卷积融合的行为识别算法。三维卷积在时序信息建模方面具有优异的性能,但计算开销也较大。将二维卷积与三维卷积结合,拟解决计算开销过大的问题。算法利用二维卷积网络进行图像特征的提取,利用三维卷积网络对特征图像进行时序建模,捕捉视频的时序特征,由此建立视频全局特征。为了区分不同特征对识别任务的贡献,在二维卷积与三维卷积网络结合的基本网络上引入了注意力机制,从特征通道层面为每张特征图赋予不同的权重值,增强运动特征,抑制无用信息。在大型行为识别数据集UCF101上进行了验证,结果表明该算法采用端到端的训练方式,简化了训练过程,并取得了不错的识别效果。为了增加算法的说服力,与先前的研究结果进行了对比,实验表明本算法具有一定的竞争力。
其他文献
以氯化镁和碳酸氢铵为原料,采用水热均匀沉淀法制备了纳米氧化镁,研究了制备工艺参数对纳米氧化镁产率和粒径的影响,并对其形貌和红外吸收进行了表征。结果显示:通过控制工艺参数,可以得到分散性好、粒径较小且产率较高的纳米氧化镁粉体;最优化的工艺参数为沉淀剂与镁离子的摩尔比2:1、反应温度160℃、反应时间3h、煅烧温度600℃和煅烧时间1h。
期刊
代谢相关脂肪性肝病(Metabolic associated fatty liver disease,MAFLD)是以肝脏脂质积累和脂肪变性为特征的慢性肝病,全球范围内发病率高且呈快速上升趋势。MAFLD与2型糖尿病(Type 2 diabetes mellitus,T2DM)和肥胖等代谢性疾病密切相关,也是最终发展为肝细胞癌的危险因素。MAFLD的发病机制复杂,目前尚未有批准用于治疗MAFLD的
学位
<正>新能源发电出力具有随机性、波动性,电力电量时空分布的极度不均衡带来了充裕性挑战;新能源发电设备具有低抗扰、弱支撑性,新能源发电大规模替代常规同步机组,给系统带来了安全性挑战;新能源发电的安全高效消纳,对系统的灵活调节资源和安全稳定支撑能力提出了更高要求,需要多技术、多行业乃至多系统协调实现,带来了可用性挑战。新能源利益主体多元化,环境-安全-经济协同难度大,带来了体制机制挑战。
期刊
<正>在实战中,特种部队的特种兵需要熟练运用各种战术动作和技巧,以应对复杂的环境和险恶的对手,机动快速完成各种特殊任务。特种兵的战术动作和技巧有哪些?在此为您展示——1为了具有更好的火力持续性,特种兵一般会把2个或2个以上的弹匣绑在一起,为了避免相互干涉,通常将弹匣口部上下反着绑在一起,这种方式称为"森林风格",是最早采用的一种方式。2但是由于向下的弹匣口部容易进入杂物或者碰撞而掉落枪弹.所以这种
期刊
近年来,随着人工智能技术的飞速发展,视频行为识别方法受到了广泛关注。现有的行为识别方法主要基于单倍速特征进行研究,较难识别外观相似的运动类。人体运动和其行为速度有着千丝万缕的联系,利用人体运动的多倍速特征进行行为识别能够有效提升识别效果。同时,现有方法较倾向基于单模态数据的行为识别研究,但单模态数据存在特征形式单一、特征表达不足等问题,严重影响了识别效果。每种模态数据中都包含着丰富的关键特征信息。
学位
自1978年改革开放以来,我国经济建设取得了世所罕见的历史性成就。据国家统计局数据显示,2020年我国GDP首超100万亿元,稳居世界第二位,但经济高速增长也带来了环境污染严重、资源利用效率低下、生态系统失衡等问题,严重影响了人民群众的生活质量。虽然党的十八大工作报告中强调要大力推进生态文明建设,近年来环境质量也确实有所改善,但是根据2019年发布的《中国环境状况公报》显示,我国337个地级市重度
学位
基于区域协调发展与乡村振兴战略,本文提出共享理念视域下省际交界村落景观设计研究这个课题。以赣皖省际交界村落作为研究对象,通过对赣皖省际交界村落景观现状的调研,结合国内外关于省际交界景观、边界景观共享设计的相关理论与实际案例,分析可借鉴之处,探索如何通过“共享理念”构建赣皖省际交界村落景观。论文共分为七个部分。首先,文章阐述了关于省际交界村落景观设计的研究背景、目的与意义,分析了本研究主题范围内国内
学位
随着来华外国人不断融入经济社会活动,各类涉外不安定、不和谐因素急剧增加,为基层公安管理工作带来极大挑战,成为亟须解决的社会性问题。面对量大面广、严峻复杂的在华外国人管理形势,宁波市镇海区建设了“多维数据研判系统”,通过多维数据和移动终端的应用以及外国人管理服务资源建设,达到辖区外国人住宿登记更加精确、涉外案(事)件预警处置愈发及时、涉外管理服务质量大幅提升的良好效果。加强和改进基层公安机关外国人管
期刊
中国古代插花与养花所涉及的器具众多,自历朝历代,诞生了许多不同材质与样式的花器,随着古代制瓷工艺的发展,陶瓷成为花器的主要材质。随着人们对生活简约化和个性化的推崇,对陶瓷花器设计的要求也日益增高。本课题以当代景德镇陶瓷花器设计为主要研究对象。通过此课题的研究,探讨人们的生活方式与审美情趣,进一步了解人们的精神需要,从而创造出既符合当代审美又能发扬民族精神与传统造物精髓的陶瓷花器。本课题首先对当代景
学位
行为识别是指对视频序列中的行为进行识别的一类任务。基于骨骼节点特征的行为识别任务主要使用图卷积网络,图卷积网络方法主要包括静态方法和动态方法两种。在静态方法中,基于人体骨骼节点形成的拓扑结构在整个网络训练过程中保持不变。这种方法虽然比较简单,但是却无法有效表示特定动作下两个节点之间的连接关系,且泛化能力比较差。而在动态方法中,大多数工作将输入数据通过全局化操作得到任意两个节点之间的关联关系,有效弥
学位