现实场景下的视频行为识别关键技术研究

来源 :东南大学 | 被引量 : 2次 | 上传用户:owen1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频行为识别任务是计算机视觉领域中的热门研究内容。视频行为识别主要研究如何最大化地提取和分析视频中的图像信息和运动信息。近年来,视频行为识别的主流方向是采用深度学习方法,并已产生很多优秀的方法和网络架构。由于视频中长距离依赖信息是不可或缺的,本文着重研究了非局部NL模块在3D卷积网络和高效在线视频理解网络ECO的应用,以及非局部网络异常行为检测这三个方面的问题。本文的主要工作如下:1.针对3D卷积网络架构进行结构改进,提出了一种基于非局部操作的(2+1)D网络NL-R(2+1)D。行为识别任务的一种先进的网络结构是在3DCNN中进行非局部特征融合的非局部网络NL-I3D,非局部模块通过非局部平均思想融合长距离信息,其输入输出尺寸相同的特性可以方便地接入现有的网络中。针对NL-I3D网络的结构优化,将3D卷积改进为(2+1)D卷积,提出了NL-R(2+1)D网络。仿真结果表明NL-R(2+1)D网络可以有效对非局部信息进行获取。2.针对视频行为识别任务的实时性需求,利用非局部模块捕捉长距离依赖信息的特性,提出一种非局部信息融合的高效在线视频理解网络NL-ECO。高效在线视频理解网络将输入视频进行分割采样,在2D卷积网络中学习单帧的外观特征,再应用3D卷积网络学习帧间关系,该网络具有高效、实时的特性。本文在ECO网络基础上,采用NL模块进一步学习帧间关系,尤其是长距离的关系,有效提升了网络的准确性,并且保持了网络的实时需求。3.针对异常行为检测任务,本文结合了所提出的非局部网络,设计了一种基于多示例学习与非局部网络的异常行为检测方法。由于异常检测任务存在数据稀疏性强,并且类内多样性高的问题,采取了多示例学习的框架进行异常判决。本文首先对视频进行分包和分段,并对正负样本中的视频片段进行特征提取和异常评分。仿真结果表明基于非局部网络的多示例异常行为检测方法能够很好的完成异常行为检测任务。
其他文献
以2,4,6-三羟基苯乙酮和柠檬醛为起始原料,经环化、保护酚羟基、羟醛缩合、脱保护、催化环化等反应以5.9%的总产率完成了天然产物(±)-2-甲基-5-羟基-2-(4'-甲基-3'-戊烯基)-二
介绍了一种利用SM400型吸烟机测定卷烟阴燃速率的方法。实验结果表明,该方法具有提高实验效率、操作简便和测定结果准确、重复性好的优点,可以同时进行20支卷烟的阴燃测定。对
通过"欧姆定律"的教学实践和反思,突破教学难点,在问题和小制作的引领下,帮助学生厘清电流与电压、电阻的定性关系;以问题引导学生明确研究对象,设计实验方案;实验探究中引导
流动性风险是企业最主要的财务风险,包括企业经营净现金流、投资净现金流、筹资净现金流恶化而产生的风险。净现金流的不足会严重影响企业的正常经营,因此,运用适当的金融工具加
中小企业对经济的发展与社会的稳定起着重要作用。一些中小企业由于没有建立和完善内部控制制度,经济发展受到严重制约。加强中小企业内部控制制度的建设是促进企业健康发展
PROTOS 70卷接机组烟支分离鼓的凸轮机构由于加注润滑油困难,且与负压相通容易吸进灰尘或烟末等问题,使凸轮机构经常处于无润滑且有灰尘的环境下运行,造成滚子和凸轮之间磨损,影
近年来,我国民航产业处于高速发展阶段,航空运输业务量也在显著增加,但是由于机场的发展速度逐渐无法跟上航空业务量增长的脚步,使得各大机场都出现了运行状态不佳的现象。作为机场的领导管理人员,迫切的需要一套既客观又科学的关键性评价方法,能够通过日常的运行生产数据和运行安全数据的反馈,更为直观的了解机场运行状况,及时做出正确的决策。本文在此背景下,参考了国内外现有的针对机场运行这一领域的相关研究文献资料,
当前,中国特色社会主义已进入新时代,随着我国社会的快速发展,人们的物质生活越来越丰富。与此同时,人们快节奏的生活和强大的竞争压力,导致心理障碍和心理疾病的人数也在逐
为了保证盾构隧道衬砌结构的安全性,通过工程试验数据,利用均质圆环法和梁-弹簧模型,对比分析了考虑管片环向接头刚度与否对衬砌结构力学特性的影响;并对环向接头刚度值的大
YB55包装机的透明纸拼接装置为手动式,需上游ZB45硬盒包装主机停机才能满足YB55透明纸手动拼接的时间要求,影响设备有效作业率。为此,设计了一套气动式透明纸自动拼接装置。该装