不规则视频数据集下的深度时序特征建模研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ziyi1965
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频目标检测越来越广泛地应用于各行各业,并具有极其重要的研究意义和实际应用价值。论文通过应用经典图像和视频检测算法于专业病害和虫害视频数据集后,发现这些经典算法针对专业病虫害数据集的检测率不佳。其原因在于病虫害数据集较其它数据集的目标(如病斑)形状不规则、帧的前景背景杂乱等;而视频检测本身也具有存在视频中物体运动模糊、物体遮挡、物体形变、视频散焦等固有难点。因此,视频检测相比图像检测,难度更大,面临的挑战更多。针对上述问题,论文提出了基于视频序列的深度时序特征建模研究,将视频序列就深度特征和时序特征分别建模。深度特征建模能加强帧内的深度语义特征的提取;而时序特征建模能增强视频帧的时序信息特征的应用,是解决视频检测效果不佳的另一个有效方法。论文的主要研究工作与创新点如下:(1)定义了视频时序信息及其数学表达式,归纳了现有的视频目标检测方法,明确了提取帧之间的时序信息、提取关键帧是视频检测的方向之一。分析了视频、视频帧时序信息、视频目标检测的特点,以及视频中有物体运动模糊、物体遮挡、物体形变、视频散焦等特点的原因。(2)针对水稻病虫害视频检测平均精度较低、检测识别错误率较高的问题,借鉴了传统方法中提取深度语义特征的思想,提出了一种基于深度神经网络(DCNN)的特征提取方法,提升了水稻病虫害检测方法的性能。与一些知名算法相比,提出的深度神经网络方法取得了先进的检测结果以及较好的泛化能力。(3)提出了一种阶梯型的数据采样器结构,增强了 LSTM模型利用帧之间时序特征信息的能力,进行了时序特征建模。提出的阶梯型数据采样器能够加速LSTM模型的收敛,从而提高LSTM模型的学习速度。同时,提出的方法拓展到UCF101人类动作识别数据集上进行视频检测实验,结果验证了本方法的泛化能力。实验结果显示,该数据采样器能够提高视频检测准确率。(4)提出了一种包含ResNet-50深度特征建模和上下文LSTM时序特征建模的LSTM模型,提出了模型训练中的信息传输损失,在UCF101人类动作识别数据集上进行了检测实验,实验结果验证了分类器的准确率和健壮性,在UCF101的全部验证集上取得了先进的top-1准确率,实验结果也验证了模型具有较好的泛化能力。
其他文献
本论文先总结了电化学发光(ECL)的基本概念、原理、典型反应体系、常见的ECL生物传感器分类以及信号放大技术在ECL生物传感中的应用,介绍了 DNA分子逻辑体系的概念、大致分类、应用、急性心肌梗死的概况及其生物标志物等内容。然后围绕着ECL生物传感器研究中普遍关注的一些关键问题(如灵敏度、选择性、稳定性、重复性、普适性等)和DNA分子逻辑器件的运行能力的提高开展了以下研究:一、构筑基于信号放大技术
学位
[目的]分析总结杨传华教授治疗高血压的思路。[方法]通过随师临诊,整理医案,总结杨教授临床预防及治疗高血压的经验,以藏象理论、血脉理论、络脉理论为出发点,总结治疗高血压的理论,并附一验案予以佐证。[结果]杨教授认为,肝、脾、肾三脏为高血压疾病的病机核心,且青年在肝,以调肝为主;中年在脾,以健脾为要;老年在肾,以补肾为需。并提出从微观脉道和血脉理论方面治疗高血压疾病的新思路,认为络脉的异常可直接从微
期刊
世界能源消耗很大程度上依赖化石燃料的燃烧,其引发的能源和环境危机使得能源转型成为21世纪人类社会面临的重要课题和挑战。同时,为满足电动汽车、手机、柔性电子等各种新型设备的供电需求,开发低成本、高效、清洁、可再生的新能源转换和存储装置(如锂电池和电解水装置等)至关重要。然而,目前这些新能源装置的电极材料仍然难以满足实用化性能或者严重依赖于贵金属基材料,阻碍了新能源装置的大规模发展和商业化应用。3d过
学位
中子散射超导磁体产生的稳态磁场广泛应用于散裂中子源装置中的样品环境谱仪,对于改善中子散射样品环境的实验技术,意义深远。为了能够得到适用于中子散射的稳态磁场,需要对中子散射超导磁体的多维度参数进行实时检测,并对采集的多维度参数进行分析计算,得出相应的控制指令,有效可靠的控制中子散射超导磁体的主要设备,保障超导磁体安全稳定运行。针对中国散裂中子源样品环境对稳态强磁场的需求,本论文主要针对中子散射超导磁
学位
电子与物质相互作用时的二次电子发射与许多研究和技术应用相关,这些应用领域包括扫描电子显微镜、航天器工业、高能加速器和辐射生物学。然而,即使在二次电子发射现象被发现一个世纪后,由于测量数据存在较大偏差,仍然很难有可靠的实验数据。此外,传统的理论方法不能描述与材料相关的二次电子产额,也没有计算绝对产额的公式,可用的公式仅针对约化产额。因此,非常需要一种准确和有效的新方法,在足够广的入射能量范围内预测元
学位
中国幅员辽阔、地形复杂,在地理上依据高原、山地、丘陵和平原的分布及地势走向,将中国地域分为三级阶梯。独特的三级阶梯地形分布形成了我国独特的气候格局,其中也包含了这种地形对东亚大气环流、云降水时空分布及垂直结构等大气参数的影响。研究中国三级阶梯的云降水垂直结构及其大气温湿结构等特征,可以认知地形对降水产生作用的规律,并为数值模式模拟地形降水提供观测依据。本文利用热带测雨卫星(TRMM)上搭载的测雨雷
学位
本论文主要聚焦于两方面研究,其一是以XY模型为载体研究系统纠缠熵(α-Rényi)的有限尺寸效应及其物理意义,并推广到多体离散块系统。本文简单地回顾了香农熵、互信息的性质,然后将这些性质推广到纠缠熵(α-Rényi);接下来将详细介绍纠缠熵的解析计算方法,并以XY模型为例来探讨系统分别处于无能隙相和有能隙相的有限尺寸效应;最后考虑了多体情形,我们计算了均匀膨胀多体离散系统的有限尺寸效应,其性质与单
学位
随着电子产品朝小型化、大功率和高频率的方向发展,系统级封装和3D封装亟需高性能的电子封装材料。5G通讯技术的发展加快了高性能电子封装材料的研发。聚合物因其优异的性能已经被广泛应用于电子封装材料中。但是,随着系统集成技术的发展,聚合物的导热性能差进而引起的芯片热集聚问题逐渐成为制约电子器件发展的瓶颈。目前关于聚合物基电子封装材料导热性能的提升已有大量的报道,包括聚合物本体导热系数的提升和填充型高导热
学位
在高校声乐教学中渗透审美教育,不仅能充分挖掘学生的音乐潜力,还有助于学生树立正确的人生观和价值观,指引他们建立健全的人格并拥有积极乐观的心态。在高校的声乐教学中,无论是作品的意境还是歌曲内容,都蕴含着强烈的美学因素,都能对学生的审美价值取向和艺术表现力进行正确引导。本文将站在高校声乐教学审美教育渗透的角度,对现如今高校声乐教学存在的问题进行简要分析,并深入研究审美教育渗透路径,希望能促进高校声乐教
期刊
虚拟数字人一直是三维视觉和计算机图形学的研究热点,相关技术更是广泛应用于AR/VR、全息通信、影视/游戏制作等多个领域。数字人的基本研究可描述为将人以及与之相关的人体、人脸以及服装等对象进行数字化表示,表示内容则往往涉及数字人的几何外观和语义信息。前者旨在对数字人的三维几何和材质外观进行高保真的描述刻画,后者则致力于对数字人的语义信息进行有效表示,它们分别对应数字人的外在呈现和语义概括,并可通过数
学位