【摘 要】
:
视频目标跟踪是指在仅给定待跟踪目标初始帧目标框的情况下,通过一系列视觉方法提取到目标的特征,并在视频后续帧中自动地得到目标的位置和大小。近年来,基于孪生网络的目标跟踪算法在精度和速度指标上达到了很好的均衡,成为目标跟踪领域的主流研究方向。现有的基于孪生网络的目标跟踪算法主要研究的是任意通用场景下的任意目标的跟踪问题,然而在实际场景中,由于光照的存在,跟踪精度往往会受到目标产生的阴影的影响。此外,这
论文部分内容阅读
视频目标跟踪是指在仅给定待跟踪目标初始帧目标框的情况下,通过一系列视觉方法提取到目标的特征,并在视频后续帧中自动地得到目标的位置和大小。近年来,基于孪生网络的目标跟踪算法在精度和速度指标上达到了很好的均衡,成为目标跟踪领域的主流研究方向。现有的基于孪生网络的目标跟踪算法主要研究的是任意通用场景下的任意目标的跟踪问题,然而在实际场景中,由于光照的存在,跟踪精度往往会受到目标产生的阴影的影响。此外,这些算法通常是针对彩色视频设计的,但是对于一些特定任务场景需要对单色视频中的目标进行跟踪。单色视频由于对比度低和颜色信息缺失等特性使得目标跟踪更加困难。本文在总结和分析目标跟踪领域研究现状的基础上,重点研究了包含阴影的单色视频的目标跟踪问题。主要工作如下:(1)提出了一种基于阴影感知的单色视频目标跟踪算法,以降低阴影对单色视频目标跟踪精度的影响。该算法网络框架总体上由孪生网络和区域候选网络两部分构成。孪生网络主要用于对输入图像对进行特征提取,区域候选网络主要用于候选框的生成,利用候选框的分类和回归结果确定目标框的位置。(2)在孪生子网络部分,提出了基于阴影先验信息的阴影感知模块。该模块可以将阴影先验分支提取到的特征以空间注意力的方式作用于图像分支提取到的特征中,从而增强图像分支中阴影与非阴影区域的特征对比。(3)为了提取到更加精细的特征,构建了选择性特征融合模块。该模块可以根据跟踪目标的不同而自适应地调整感受野的大小,得到对目标更具有辨别力的特征,从而进一步提高跟踪器的性能。(4)针对单色视频序列的特殊性,在训练数据集中使用随机改变检测图像亮度或对比度的数据增强方式,使得模型在单色视频中学习出对光照变化更鲁棒的特征表达,同时提高跟踪器对目标阴影区域的抗干扰能力。(5)此外,针对当前公开的目标跟踪数据集中包含阴影的视频序列较少,故为了更好地验证本算法的有效性,本文还构建了一个视频序列包含阴影的目标跟踪数据集SSOT(Shadow Scene Object Tracking)。SSOT数据集主要通过在具有阴影的场景中拍摄视频,并经过真值目标框的标注得到。主要由53个视频序列组成,包含建筑、树木、赛车手等场景。本文算法是在Ubuntu16.04系统环境下使用Py Torch深度学习框架搭建模型实现的,模型在单色化后的公开目标跟踪视频序列上和新建的SSOT数据集上进行测试,并与现有目标跟踪算法进行对比实验分析。实验结果表明,本文算法不仅能够在含阴影的单色视频序列中具有优良的跟踪性能,而且在无阴影的单色视频序列中也能比较好地跟踪目标,验证了本文算法的有效性。
其他文献
纪检监察机关是执行党纪政纪的专门机关,是作风建设的积极参与者和有力监督者,纪检监察干部队伍的建设直接影响着党风廉政建设和反腐败工作的成效。习近平在十九届中央纪律检查委员会第二次全体会议上强调指出:纪检检察机关就是党内的“纪律部队”,就具备高度忠诚、高度自觉,并且勇于责任担当,才能肃清党内纪律,形成清明的党风党纪,而这一切的形成格力依赖于广大纪检监察干部。纪检监察干部肩负着党内权力不被滥用的重任,手
本文主要研究了双极非等熵Euler-Poisson方程组的大时间渐近行为以及该模型光滑解的松弛时间极限.此模型是由Euler方程以及Poisson方程耦合而成的.我们研究得到了在不同松弛时间极限下,该模型光滑解与能量输运模型以及漂流扩散模型之间的联系.首先,通过构造合适的能量泛函,得到关于松弛时间的一致能量估计.其次,利用紧性分析等方法证明了在不同时间尺度下,双极非等熵Euler-Poisson方
目的肝细胞癌(hepatocellular carcinoma,HCC)是一种在世界范围内发病率和死亡率都非常高的恶性肿瘤,死亡率仅次于胃癌和食管癌,由于进展快、转移、复发率高使其患者治疗后5
近年来,全球面临着气候变暖、生态恶化等严重的环境问题,气候变化对粮食生产造成了不可忽视的影响。我国作为世界上最大的发展中国家,保证粮食生产的持续稳定和增长是维护我
本文以合浦客家方言“V落”为主要研究对象,借鉴普通话“V下”结构及其相关格式的现有研究成果,运用认知语言学、结构主义语言学和语法化的相关理论,对合浦客家方言“V落”和普通话“V下”以及两者的相关格式进行了比较研究。第一章为绪论,第二章到第六章是本文主体部分,第七章是结语。第二章到第五章从宾语位置和进入结构的动词、动态形容词的语义特征出发,对“V落”和“V下”以及两者的相关格式进行了较为细致的比较研
经营者集中有助于提升集中当事人的经济实力,增强其在市场上的竞争力,扩大原有的业务范围,并可以提高市场的竞争活力和维护社会的公共利益。因此,经营者集中成为全球市场经济中常见的一种现象。反之,若集中当事人利用其市场控制地位,违反竞争秩序、扰乱有序的市场体系,损害社会公共利益,对其进行合理的法律规制就显得异常重要。美国作为发源地,对反垄断法的研究是较全面和系统的,另外,欧洲一些国家的研究也更加体系化。随
作为无线通信中的技术基础,多输入多输出(Multiple-Input and Multiple-Output,MIMO)技术是在源端利用多天线的空间分集特点来提供增强信道容量的显著性能,同时还会提高系统在传输数据方面的可靠性。而中继技术运用到MIMO系统后,不仅可以解决信息覆盖范围差的现象,同时也能增强小区边缘用户接收信号的质量。另外,引入预编码技术的MIMO中继系统可以抑制或者消除传输信道中存在
在大数据时代下,为了追求数据处理的高效性和经济性,人们更多得把数据移交云平台,通过并行的方式来处理数据,而MapReduce就是其中最流行的一种并行编程模型。利用MapReduce模
目前国内冶金露天矿山由于矿体倾角大、岩石硬度高等特点,台阶爆破高度8~16m居多。根据理论研究及现场试验确定中间间隔长度、底盘抵抗线、孔径、超深等爆破参数,不能体现爆破参数对工程的适用性影响,参数不合理造成爆破出现根底和其它岩石的预裂效果不佳时有发生,造成矿山成本的增加。因此在露天爆破中,根底、大块作为改善爆破效果的研究引起学者的关注。露天爆破效果分析方面现有的研究主要是针对露天矿爆破参数在爆炸冲
2015年3月15日十二届全国人大三次会议通过了《关于修改的决定》,这是立法法自2000年制定以来的首次修改。此次立法法修改最大的亮点无疑是普遍赋予设区的市地方立法权,这使