基于高效特征交互的深度神经网络视频行为识别算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:xuzuhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网深入普及和视频信息被高度重视的今天,人们对于具有低延迟、大容量、高性能特点的智能视频分析系统有迫切需求。视频理解技术逐渐成为计算机视觉领域的研究重点与热点,并在安全生产、视频推荐和直播内容审核等多个领域发挥重要作用。针对实际场景中的视频行为识别问题,本文在深度学习卷积神经网络基础上,主要从以下三方面进行了研究:首先,针对局部时序信息在描述持续时间较长的复杂动作上的不足,提出基于注意力机制的时间分组深度网络行为识别算法。使用视频分组稀疏抽样策略,有效解决识别序列时间覆盖有限导致的信息丢失问题。在识别阶段引入通道注意力映射,在关注重要特征的同时抑制次要特征,提高网络的表达能力。其次,为构建拥有2D神经网络速度同时保持3D神经网络性能的视频行为识别模型,提出基于3D多支路聚合轻量网络的视频行为识别算法。利用分组卷积将神经网络分割成多个支路,使用具有信息聚合功能的多路复用模块促进支路间信息流动,引入3D自适应注意力机制对通道与时空信息进行重定向。与其他3D神经网络行为识别算法相比,体现出一定识别速度和准确率优势。最后,针对3D卷积网络虽可以进行时间建模,但参数和计算成本较高的问题,提出基于时间融合模块的高效视频理解算法。使用时间融合模块,以零参数和零计算开销对不同帧对应的部分通道进行移位操作,借用2D卷积的通道间融合能力来执行时域间信息融合。相比基线网络,插入时间融合模块的2D卷积网络可在不增加额外计算消耗的前提下获得更强的时间建模能力。
其他文献
国债下乡是人民银行落实国家乡村振兴战略和惠民政策的直接有效手段,对于帮助拓宽农民投资渠道、防范农民非法集资,提高农民收入水平和维护农村地区金融稳定具有十分重要的意义。本文立足如何切实推进国债下乡助力乡村振兴,从工作实际出发,深入分析了影响国债乡镇销售的主要制约因素,并提出了助力"国债下乡"的具体对策建议。
期刊
经络理论是进行中医针灸与推拿、中药归经和临床治病机制研究的重要依托。然经络的具体物质基础和作用机制尚未明确。生物整体功能是由细胞间信息交流协助主导,而外泌体作为细胞间信息交流的重要载体,包裹了亲母细胞的重要信息,可循行迁移,按生物超分子“印迹模板”“气析”自主产生作用,实现信使的精确远处靶向作用,协调整体生物功能。因此,承载了外泌体的水通道,体现超分子体属性的经络物质运行规律便跃然纸上。文章在现有
期刊
随着科技的不断发展,人脸识别智能锁越来越受到人们的青睐,其应用到现实的生活中,为现代化的生活增光加彩。作为一种新兴的技术,人脸识别因其独特的优势,如人脸的唯一性,在众多生物识别领域中蓬勃发展,并且其在众多领域都发挥着极大的价值。由于人们生活品质和安全意识的提高,智能锁的要求也随之越来越高,更加现代化、智能化的人脸识别智能锁系统才能满足人们的需求。本文主要研究如何更好地利用深度学习工具,将人脸识别技
学位
红外与可见光图像融合作为图像处理的研究热点具有十分广阔的应用前景。通过脉冲耦合神经网络(PCNN)实现红外与可见光图像融合,是目前该领域研究的热点和难点。本课题以多尺度分析为工具,运用脉冲耦合神经网络理论,对红外与可见光图像融合的精确性、可靠性问题进行研究。首先,针对传统的PCNN模型结构采用二值函数去模拟神经元之间的输出特性,导致神经元之间丢失大量局部相关性的问题,提出了一种S型动态输出的脉冲耦
学位
本文在Zr56Cu23Al10Ni11非晶合金组分的基础之上,用微量Ta替换Ni设计了Zr56Cu23Al10Ni11-xTax(x=0,0.5,1,1.5,2,2.5at.%)体系的非晶合金成分。利用非自耗电弧熔炼与铜模吸铸相结合的技术制备了不同直径的非晶合金棒。通过X射线衍射(XRD)、透射电子显微镜(TEM)进行表征分析非晶合金结构。通过差示扫描量热(DSC)分析非晶合金热物性参数。通过电化
学位
钛锆基合金由于其密度低、比强度高、抗疲劳强和优异的力学性能等特点,被作为一种重要的结构性材料应用于石油化工、军事装备和生物医学等方面,可以有效地适应各种特殊环境,保障生产制造和科学研究的安全性、稳定性、高效性。Mn作为一种β相稳定元素,可以扩展β相区,在钛及钛合金中添加起到合金化作用,有效改善合金综合力学性能。本文以Ti-30Zr-5Al-3V合金为基础,向基体合金中添加Mn元素。研究了Mn含量和
学位
报纸
如今企业信息化程度较高,企业内网电脑中的核心机密数据无处不在,由于缺少电子文档敏感信息的检测工具,导致含有涉密内容的文档泄露事件时常发生,造成了企业不可挽回的损失。为了能有效识别这些存在敏感信息的电子文档,防止泄密事件的发生,本文突破传统策略方法,提出新颖的检测策略,设计开发了一套基于文本内容相似性的电子文档敏感信息检测系统。首先,提出了基于文件指纹算法的文档检测策略。针对传统Simhash指纹算
学位
随着生活水平的提高,人们在满足物质需求的同时,也在不断追求精神上的享受,旅游已经成为人们越来越钟爱的休闲方式。近年来互联网和人工智能的飞速发展,越来越多的用户在网络上搜索旅游攻略。从网络资源中快速找出有意义的信息变得尤为重要,其中也蕴藏着巨大的商机。命名实体识别技术是对文本中有特定意义的实体进行识别的一项研究,是自然语言处理中最为基础和重要的一步。本文针对旅游数据进行深入地命名实体识别研究。首先,
学位
文本生成图片是计算机视觉领域一个重要的研究方向,根据文本描述中的语义关系,通过图像生成器合成一张与语义相关的图片,这是一个跨模态的交叉性任务。本文在实现文本生成图片的实验中做了以下工作:(1)利用Skip-Thoughts中的编码器将输入文本描述编码成为文本特征向量。随机噪声z和文本特征向量通过全连接层来连接在一起作为条件输入到生成网络中,而判别网络需要对生成器生成的“伪”图像、真实图像及其相匹配
学位