基于自适应尺度框选择与尺度感知定位的目标跟踪方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:a15088392710
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域中一项基础且重要的研究任务,在工业检测、智慧交通、自动驾驶等领域有重要应用。在视频的第一帧中给定初始的目标后,目标跟踪方法旨在视频的连续帧中估计该目标的范围,目标跟踪方法主要通过一个边界框来表示目标范围。随着计算机视觉和深度学习技术的发展,近年来目标跟踪方法的性能迅速提升。然而,进一步提升性能仍存在困难挑战,例如,目标的快速移动、剧烈形变、消失视野等。面对诸多困难挑战,现存的大部分跟踪方法主要通过对目标和背景进行分类以准确定位目标的位置,而估计目标范围主要是通过简单的多尺度搜索来完成。这种简单的方法并不能非常准确地估计出目标边界框。为更好地完成对目标边界框的估计,本文将跟踪任务分解为对目标的分类定位和尺度估计两个子任务。在跟踪过程中,这种分解框架首先通过分类目标和背景来得到目标的一个初始位置,然后根据该初始位置进行目标尺度的估计。基于相关滤波和基于深度卷积神经网络的跟踪方法都可通过此分解框架来提升性能。然而,基于相关滤波的跟踪方法主要通过传统目标检测领域的建议框生成方法,来进行目标尺度的估计,此类方法存在尺度建议框冗余等问题。相比之下,基于深度卷积神经网络的跟踪方法通过目标检测领域的交并比预测网络等方法,能够较好地完成尺度估计任务。但由于在线跟踪时可学习的样本较少,目标的分类定位也会受到尺度变化的影响。如何更精准地分类定位以使得后续的尺度估计更鲁棒是基于深度卷积神经网络的跟踪方法需要解决的重要问题。针对上述问题,本文的研究内容和创新点如下:(1)本文提出了一种精准估计尺度的自适应尺度框选择方法。该方法可以与大多数基于相关滤波的跟踪方法相结合以解决尺度估计问题。首先,其使用HSV颜色空间直方图,来对两个实例(一个为初始帧结果,另一个为上一帧预测结果)与产生的建议框进行表征。接着,该方法通过一个自适应的选择策略对部分冗余的建议框进行过滤,从而有效缓解了由冗余建议框而导致的性能和速度下降的问题。并且,我们将自适应尺度框选择方法与两个相关滤波跟踪方法结合,来验证所提方法的有效性和适用性。实验结果表明,提出的方法能有效地过滤冗余的建议框,从而提升跟踪方法的性能和效率。基于自适应尺度框选择的跟踪方法获得了较好的性能,在尺度变化这一挑战上表现突出。(2)本文提出了一种基于尺度感知定位的深度网络跟踪方法。在基于分类定位和尺度估计的分解框架下,其中分类定位的准确性会受到尺度变化的影响。由于在线可学习的样本较少,基于深度卷积神经网络的目标跟踪方法有可能陷入过拟合问题。因此,我们提出了一种基于尺度感知定位的深度网络跟踪方法。首先,该跟踪方法通过使用尺度变化的数据增广方法对模型进行初始化。然后,该跟踪方法使用尺度金字塔学习的方法,在每一帧的多尺度响应图中搜索目标位置。最后,提出的跟踪方法会通过交并比预测网络来完成对目标的尺度估计。实验结果表明,提出的跟踪方法在应对跟踪的许多挑战上有更好的鲁棒性,并获得了有竞争力的实验结果,而且可以达到实时的速度。
其他文献
即时检测(point-of-care testing,POCT)具有检测快速、操作简单、环境适应性强的特点,在体外诊断领域发挥着越来越重要的作用。开发高效、便携、低成本的检测设备和方法是目前即时检测的发展趋势。数字微流控(Digital microfluidics,DMF)是一种新兴的液滴操控技术,其能够实现在微电极阵列上对离散液滴进行精准操控,完成生物分析应用中的基础操作。数字微流控具有诸多优势
学位
参数曲线的弧长计算和弧长采样是两个常见的任务。弧长计算是指给定曲线的参数区间,求该区间的弧长值;弧长采样是指给定曲线上一段区间的弧长,以及该区间首端点的参数值,求尾端点的参数值,是前者的逆过程。由于参数曲线的弧长函数往往难以用初等函数表达,而使用数值方法精确计算曲线弧长的计算量十分庞大,因此这类问题在CPU上求解十分缓慢。随着近年来GPU性能的快速提高以及通用性的增强,越来越多的计算任务从CPU向
学位
自20世纪90年代初以来,许多大型跨国企业改革自身财务部,建立了财务共享服务中心,目的是解决经营全球化所带来的低效管理和成本失衡问题。在中国,很多大型企业近年来也逐步建立了财务共享服务中心。X航空公司是中国第一家自主经营的企业化航空公司,也是航空业内首家完成全业务共享化财务改革的企业。本文以X航空公司为案例,研究其建立财务共享中心制度的动因、过程和全业务共享化的效果,分析其中值得借鉴之处。本文综合
学位
随着通信网络和电子设备等的发展对高速可靠的通讯性能和有限的频谱资源提出了更高的要求。虽然多输入多输出天线系统已经展现出了它在衰落信道中提供可靠传输的能力,但是由于成本和硬件设备的限制,对于单天线设备来说,多变量控制系统是不切合实际的。合作通讯允许单天线设备共享它们的频谱资源,形成一个虚拟的多天线系统,通过这样就可以提高服务质量。大多数协作通信的解决方案都是基于静态的频谱访问,并不能很好的解决频谱的
学位
目的 探究寒喘祖帕颗粒治疗慢性阻塞性肺疾病急性加重期(AECOPD)的临床效果。方法 选取2019年8月至2021年7月我院收治的60例AECOPD患者,采用随机数字表法分为对照组和研究组各30例。对照组采用西医治疗,研究组在对照组基础上联合寒喘祖帕颗粒治疗。对比两组临床疗效、中医证候积分、肺功能指标[第1秒用力肺活量(FEV1)、用力肺活量(FVC)及FEV1占FVC的百分比(FEV1%)]和不
期刊
随着纳米技术的发展,纳米药物的应用也越来越受到关注。然而,纳米药物能够真正到达病变位点的效率却只有不到1%。纳米药物进入人体后,会被大量的生物大分子(如蛋白质)包裹,在表面形成一层蛋白质层,被称为“蛋白冠”(protein corona)。纳米药物本身以及其表面蛋白冠的存在会激活免疫系统,进而诱导单核巨噬系统(mononuclear phagocyte system,MPS)对纳米材料的吞噬行为。
学位
萜类化合物是一类由异戊二烯为基本结构单元的、在自然界中广泛存在且种类繁多的一类天然产物。在植物、真菌、微生物、昆虫、以及海洋生物,都发现了具有生理活性的萜类成分。其中很多萜类化合物是抗肿瘤、神经退行性疾病和心脑血管疾病潜在的药物,具有很高的研究价值。Arnamial是从蜜环菌属FR-P75培养液中分离出的一种原伊鲁烷型倍半萜醇芳香酯,其结构特点包括:原伊鲁烷型倍半萜的5/6/4并环三环核心骨架、外
学位
长波光学响应信号因信噪比高、组织穿透性强且对生物样品损伤小等特点而在生物医学检测中广被采用。就传统有机染料而言,长波响应信号通常依赖大共轭分子骨架而获得,故而在实际应用中常面临染料合成难度大、不易衍生、生物相容性差等问题的挑战。在本论文中,我们通过诱导简单生色团/发光团形成光谱显著红移的次生性光学系综来降低染料合成难度,并以仿生脂膜作为这些次生性超分子染料的稳定化和功能化平台实现便捷的染料性能改造
学位
甲基丙烯酸甲酯(MMA)是一种高附加值的重要化工原料,由甲基丙烯醛(MAL)一步氧化酯化制备是新的绿色工艺之一。相较于研究较多的Pd基催化剂,Au基催化剂因其催化活性及选择性更高而备受关注。本文主要研发选择性氧化酯化MAL的Au基催化剂,并探究相关各种影响因素。本文采用胶体沉积法制备不同氧化物载体的Au基催化剂,并进行活性评价,发现负载于碱性氧化铝(B-Al2O3)的Au基催化剂的活性最佳,其对M
学位
灵芝(Ganoderma lucidum)作为一种珍贵的药材受到广泛关注。灵芝孢子是灵芝的种子,含有多糖、三萜、核苷等活性成分,营养价值较高。多糖是灵芝孢子中最重要的有效成分之一,它具有抗氧化、免疫调节、抗肿瘤等作用。影响灵芝孢子多糖质量的关键在于提取技术,研究高效的灵芝孢子多糖提取技术对于其进一步的开发利用具有重要的现实意义。本论文采用不同方法提取灵芝孢子多糖,并进行了理化表征、抗氧化活性实验、
学位