【摘 要】
:
近年来随着科技的发展,使得行为识别技术也不断成熟,而获得外观信息的同时捕获帧间运动信息是行为识别的难点,双流卷积神经网络因能够捕获时空信息受到广泛关注。但视频包含噪声、光照变化等因素,以及视频行为持续时间较长都会影响识别的准确率。本文以双流卷积神经网络为基础进行深入研究,针对行为识别存在的问题,提出以下几种策略来提高识别率:(1)通过scSE模块来对图像特征进行筛选,提出融合scSE的双流网络模型
论文部分内容阅读
近年来随着科技的发展,使得行为识别技术也不断成熟,而获得外观信息的同时捕获帧间运动信息是行为识别的难点,双流卷积神经网络因能够捕获时空信息受到广泛关注。但视频包含噪声、光照变化等因素,以及视频行为持续时间较长都会影响识别的准确率。本文以双流卷积神经网络为基础进行深入研究,针对行为识别存在的问题,提出以下几种策略来提高识别率:(1)通过scSE模块来对图像特征进行筛选,提出融合scSE的双流网络模型框架。该模型能够关注通道之间的信息,并将行为特征赋予更大的权重,弱化背景信息的影响。本文将scSE处理后的特征进行可视化并分析结果,实验结果表明,scSE模块能够关注重要特征从而提升网络的识别率。(2)在融合scSE双流网络模型框架基础上,提出“分段-融合”策略,采用BNInception网络,提出scSEBNInception双流网络。该网络对特征进行筛选的同时,能更好的处理长时序视频的识别问题。首先将原始视频划分为等长不重叠的K个时序段,再从每段中稀疏采样RGB视频帧和光流图输入scSEBNInception双流网络中,最终融合K段识别结果。与双流卷积神经网络、时序分割网络等算法相比,scSEBNInception双流网络在保证运行速度的前提下,提高了行为识别的准确率。(3)采用ResNet 101来构造双流模型,并在此基础上增加scSE卷积层来筛选特征,减少噪声干扰,增加非局部层来关注长距离依赖并获取全局信息,提出SCNLResNet双流网络。在UCF101和Hmdb51数据集上与scSEBNInception双流网络以及其他算法进行对比,实验结果表明,SCNLResNet网络可以有效提高包含噪声、光照变化等因素的视频行为识别的准确率。论文以融合scSE的双流网络为基本框架,提出scSEBNInception网络在保持速度的同时提高长时序视频的识别率,SCNLResNet网络能更好的处理噪声变化和光照变化的影响。在UCF101和Hmdb51数据集上识别率分别达到96.4%、71.3%和96.9%、76.2%。
其他文献
温室环境具有多参数因子、非线性、时滞性及强耦合的特点,为准确判断温室内的环境状况,需要对温室中多环境参数进行综合,从而为温室管理者提供准确的温室调控决策支持。因此,论文针对温室信息融合决策问题,以D-S证据理论为基础,提出一种改进D-S证据理论的决策级融合算法复合框架,为温室调控系统提供决策支持。主要工作和创新点如下:(1)针对D-S证据理论中,由于现有生成基本概率赋值函数BPA方法缺乏考虑证据中
数学学习的主要任务在于发展学生思维力。学生数学思维力欠缺,追根溯源是学生数学学习过于关注一个个零散独立的知识点,缺乏知识的整体建构观念和能力。本文基于辩证唯物主义联系观,基于学为中心,引导学生结合数学自身特点学习整体的结构化数学,让学生自己"织网",连点成链,织链成网,让学生经历比较辨析、归纳整理、聚合发散、融会贯通等深度思维过程,最终将知识与技能、思想与方法融为一体,感受数学的魅力。
视觉同步定位与地图构建(Visual Simultaneous Localization and Mapping,vSLAM)是实现移动机器人自主定位和导航的核心技术,已被广泛应用于自动驾驶、智能家居及航空等领域。闭环检测作为vSLAM系统的一个重要模块,它通过识别机器人是否到访之前经过的位置,可以有效地减少累积误差并校正构建的地图。经典的闭环检测算法应用于复杂环境时存在准确率低、耗时长及鲁棒性差
指纹识别技术作为应用最广泛的生物特征识别技术,已经普及于智能门锁、打卡机等电子设备的身份认证之上。随着指纹采集器变得更加小型化与轻便化,使得采集到的指纹图像越来越小,应用传统的指纹识别方法针对小面积指纹图像进行识别,会导致正确识别率大幅降低,同时LED灯作为光学指纹采集器使用最频繁的背光源,存在功耗大、背光不均匀等不足。因此,本文设计了一种应用PMOLED(Passive Matrix OLED)
煤炭资源是我国重要的基础能源,采煤和洗煤的工艺过程中煤矸石含量的高低极大的影响了煤的纯度和质量,因此煤矸石的分选对提高煤炭自动化生产效率有着重要的意义。传统的煤矸分选方法效率低下、污染环境、成本过高,已经不能满足当今智慧矿山的发展需求。基于此,本文对传统分选方法进行总结和分析,从图像识别角度,提出采用图像纹理特征参数和深度学习技术进行煤矸石分选的方法,主要研究内容如下:论文以陕西韩城象山矿井所采集
近年来我国浅层煤炭储备逐渐减少,深部开采的比重随之逐年上升,而瓦斯的有效抽采在一定程度可消除煤矿深部开采带来的安全隐患。因此针对瓦斯安全、高效抽采的需要,对瓦斯抽采系统进行智能调控具有重要的研究意义。为了提高瓦斯抽采的安全性及效率,降低瓦斯抽采的经济成本,分析了瓦斯抽采系统运行的安全约束条件及效率约束条件;分析了瓦斯抽采系统四大控制任务并建立了瓦斯抽采优化数学模型;根据理论调控策略,提出了瓦斯抽采
视觉惯性里程计作为自主移动机器人和相关领域的一项重要技术,拥有广泛的应用前景。利用图像信息与惯性测量单元(Inertial Measurement Unit,IMU)信息的互补性可以更加准确地计算传感器位姿变化情况,并增强系统的鲁棒性。因此,进行视觉惯性里程计的研究具有十分重要的理论意义与应用价值。针对视觉惯性里程计在处理图像信息时,特征点正确匹配率较低的问题,改进SIFT(Scale Invar
随着传感器技术的发展,霍尔电流传感器在工业自动化、汽车电子、航空航天和国防等领域得到了广泛的应用。但是,电路中存在闪烁噪声和失调电压、霍尔元件灵敏度受温度影响会发生改变,这些因素严重影响了霍尔电流传感器的检测精度。因此,研究噪声、失调电压抑制技术以及灵敏度温度补偿技术,设计一款低噪声、低失调电压和灵敏度温度特性良好的霍尔电流传感器芯片具有重要理论意义及工程应用价值。通过分析霍尔元件失调电压的来源,
随着网络的快速发展,以网络为载体的信息量迅速增长,使得图的规模也随之扩大。由于大规模图数据无法使用单机环境进行处理,因此分布式图计算应运而生。分布式图计算需要将图数据合理地分布到每个节点,对图进行合理划分是实现分布式图计算的前提。现实世界的图处于不断的动态演化之中,如何对动态图进行合理划分是当前的一个研究热点。针对动态图划分问题,本文的主要研究内容如下:首先,研究新增图社区性对动态图划分质量的影响
传统传感器存在体积大、灵敏度低、污染样本的缺点,利用超介质的非常规特性,可以克服原始材料的局限。与传统传感器相比,超介质传感器具有设计简单、灵敏度高、选择性强和检测即时等优势。在开环谐振器(SRR)和互补开环谐振器(CSRR)结构的基础上,设计并研究两种超介质传感器。通过对比两种传感器,超介质可以为传感器的设计和性能的提升提供新的思路和方法。本文主要工作总结如下:(1)提出一种基于四个六边形互补开