【摘 要】
:
近年来,由于深度学习技术的快速发展和行为识别算法广阔的应用空间,基于深度学习的行为识别成为了计算视觉领域的研究重点之一。行为识别不同于图像识别,行为识别的关键在于学习视频的时空特征,而图像识别主要专注于图像的空间特征,因此行为识别对识别算法提出更高的要求,不仅需要学习时序特征又需要学习空间特征。而目前基于深度学习的行为识别算法,时空特征的学习上都存在偏向于空间特征的学习,而相对缺少对时序特征的建模
论文部分内容阅读
近年来,由于深度学习技术的快速发展和行为识别算法广阔的应用空间,基于深度学习的行为识别成为了计算视觉领域的研究重点之一。行为识别不同于图像识别,行为识别的关键在于学习视频的时空特征,而图像识别主要专注于图像的空间特征,因此行为识别对识别算法提出更高的要求,不仅需要学习时序特征又需要学习空间特征。而目前基于深度学习的行为识别算法,时空特征的学习上都存在偏向于空间特征的学习,而相对缺少对时序特征的建模能力。目前,双流卷积神经网络存在光流提取速度太慢的问题,而基于3D卷积的行为识别方法存在对视频的空间特征有较大的依赖,容易受背景噪声的影响以及鲁棒性较差的问题。针对这些问题,本文进一步分析双流卷积神经网络和基于3D卷积的方法,并且吸收两种方法的优势,提出一种泛化性更好的多频率时空特征提取方法。具体来说,一方面是利用3D卷积的方法直接从视频中提取时空特征,避开提取密集光流这一耗时流程。另一方面是从多种频率的角度扩展双流卷积神经网络,从而提升时序特征的建模能力,减少对空间特征的依赖。本文的主要有贡献如下:1.结合双流卷积神经网络和3D卷积的优势,提出一种基于多频率的时空特征学习方法。避免了双流卷积神经网络中耗时的光流提取过程,并且缓解了3D卷积对空间信息的依赖。在大规模Moments in Time数据集上,分别在top1准确率和top5准确率上取得1%和2%左右的提升,并且模型计算量比C3D模型小20 GFLOPs左右。2.把多频率时空特征扩展到骨架行为识别,提出一种基于图卷积的多频率时空特征的学习方法,在NTU-RGBD数据集和Kinetics-skeleton数据集上最高能够提升5%左右的识别准确率,并且超越近期的一些基于图卷积的行为识别方法。3.融合两类主流的行为识别方法的各自优势,提出一种从多种采样频率的角度来理解视频的时空信息的方法,并且在视频数据集和骨架数据集上验证了该方法的泛化性和扩展性以及有效性。
其他文献
钙钛矿太阳能电池自2009年诞生以来,其光电转换效率在短短的十几年内由3.81%跳跃式的攀升到25.5%,而空穴传输层作为钙钛矿太阳能电池中必不可少的一部分,改善空穴传输材料的性能可以提高器件的光电转换效率和使用寿命。本文采用密度泛函理论研究了三个体系的空穴传输层材料对开路电压、短路电流、填充因子等器件性能的影响,希望可以为研制低成本且高效率的空穴传输层材料提供可靠的理论指导。本文的研究内容主要从
随着大数据和人工智能(AI)的高速发展,中央处理器(CPU)在大数据并行计算上显得力不从心,越来越多的软件开发人员开始使用计算机硬件中的图形处理器(GPU)的多线程并行计算来获得更高的性能和效率,使一些大规模且复杂的计算相比CPU运算节省了几倍甚至几十倍的时间。为了分析晶体的原子尺寸的结构,透射电子显微镜(TEM)及像模拟技术是重要且不可少的工具,实际应用中,常通过商业软件或非商业软件来模拟TEM
随着科技中电子技术的逐渐发展,许多电气设备朝着小型化、高密度、高集成度以及高效率方向发展,其中照明电源首当其冲。首先,论文介绍了光伏储能LED电源照明系统的背景和无源元件集成技术的发展,针对光伏储能照明系统所遇到的问题充电效率低、体积大以及间歇性输入电压特性导致输出不稳定提出了解决思路,进而分析了本课题的意义和作用。其次,本文将光伏储能和谐振电路相结合,并且充分考虑到LED照明系统的应用场景,因此
二氧化钒(VO2)作为一种过渡金属氧化物,其VO2(M/R)在68℃附近能发生可逆转变,同时伴随着优异的近红外波段调节特性,使得它成为智能窗材料领域的研究热门。然而将其应用于智能窗上时,存在相变温度过高、太阳能调节率过低以及制备成薄膜后颜色呈现黄色等问题。基于此,本文分别采用W-Fe和W-Mn共掺杂制备了低相变温度VO2粉体,并研究了掺杂元素对合成M相VO2的影响,进一步将热致变色微胶囊与VO2粉
群体行为识别研究至今,已然变为计算机视觉领域研究的一个热点,在智能控制、无人驾驶、虚拟现实等方面有着辽阔的学术前景和不可估量的工业价值。群体行为识别是对群体行为进行有效的表示及分类的研究,由于视频采集中容易出现遮挡和未对准的问题导致背景混乱,以及个体之间的关系复杂等原因,使其成为一个具有挑战性的研究。现有的群体行为识别方法虽然取得了一定的成果,会关注个体与个体之间和其所在群体之间关系的信息,但在一
随着科技发展和用户生活水平提高,化石能源导致的环境问题日益险峻,可再生能源结合信息技术快速发展,能源互联网的概念被提出并快速发展,电网是能源互联网中重要的组成部分,传统电网已无法满足用户需求,作为提高信息互享及智能配电的新思路,智能电网得到大力发展。智能电网的关键要素是用户侧电力分配,故精准的用户侧负荷预测对智能电网的合理运行和经济调度有着重要联系。本文以智能电网用户侧负荷预测作为研究背景,将设计
传统燃油汽车的使用加剧了能源的紧张和一系列环境问题,新能源电动汽车的出现在很大程度上解决了这一难题。因此对于电动汽车的研究受到了极大的关注,其中电动汽车充电问题是目前的一个研究热点。由于在实际的供电场合下,利用新能源(风能、太阳能)进行电能补给的稳定性欠佳,导致系统输出电压波动。为解决新能源对电动汽车供电稳定性问题,开展基于变换器的系统输出电压稳定的控制策略研究,对提升电动汽车充电系统的效率以及鲁
对环境中有毒、易爆的气体(例如H2,H2S,NO2)的快速、连续监测对人类生命和工业安全具有重要意义。先进的气体传感技术需要传感器具有高灵敏度,小型化和低功耗等特点。目前主流的商用气体传感器是基于电阻金属氧化物半导体(MOS)型的,但是由于它的体积较大且工作温度高于200°C,所以在先进的气体传感技术中并不受青睐。近年来,利用纳米材料(包括纳米线、纳米管和二维材料)来构建室温下高灵敏度、高选择性的
随着现代政府管理水平的提升和发展,社会对政府服务的要求也进一步提升。政府机构只有不断提升自身能力,转变服务态度,提升服务水平,才能满足新时期政府服务的需求。在这个大背景下,过去有着强制特性的税务部门的管理理念也发生了相应的变化。近年来,国家税务总局不断出台相应制度,以更好提升纳税服务水平,各地在实践中将国家的相关服务制度和要求落到实处,在一定程度上促进纳税服务体系的改进。随着减税降费政策不断深入,
“智慧”的概念在IBM提出之后在多种领域进行了广泛的应用,未来图书馆的服务也朝着智慧服务的方向发展。大数据时代,怎样运用区块链、人工智能、虚拟现实等前沿技术,推进图书馆改革创新,为广大师生提供更加智能、快捷、个性化的优质服务,已成为当前业界讨论的热点和焦点。基于此,本文以大数据时代高校图书馆智慧服务存在的问题及对策研究为课题展开研究。运用问卷调查、访谈等方式,对选取的连云港地区的六所高校图书馆的智