基于深度学习的视觉单目标跟踪方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wc8861
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪是计算机视觉领域中最具挑战性的研究课题之一,它可以为机器人提供对指定目标的跟踪、定位和识别,并将目标或环境的参数提供给控制器供后续使用。为了研究视觉目标跟踪问题的本质和适应其在现实流行场景中的广泛应用,许多大规模的基准数据集已建立,针对目标跟踪领域中的不同问题,相当多针对性的方法也被提出。近年来取得的重大进展主要是通过基于深度学习(Deep Learning)的方法。虽然目标追踪的应用前景非常广泛,但还是有一些问题限制了它的应用,对于一个运动的物体,由于物体本身加上镜头的运动,其运动轨迹非常复杂并且经常发生变化,给视觉目标跟踪带来许多挑战:·形态尺寸变化。在跟踪过程中,目标物体由于远离或者靠近镜头会发生尺寸的变换,同时,由于物体的刚体旋转运动,其呈现在画面上的形态也会发现变化。·目标丢失。目标在运动过程中可能出现丢失或者被其他物体环境遮挡的情况。当这种情况发生时,跟踪器容易错误跟踪相似的遮挡物,会导致后续序列中的跟踪结果偏移到错误的物体上。若目标在画面中消失,还需要重新检测。·背景干扰。目标在跟踪过程中,可能出现的背景具有多样性和不可预测性,很有可能出现与目标外观颜色相似的背景场景对跟踪系统会造成了干扰。·图像模糊。由于环境亮度的变化,图像的清晰度低或者目标物体运动速度过快等情况会影响跟踪器模型的判断。因此,提高特征提取器的判别性对目标和背景进行区分非常重要。为此,本文针对跟符合现实应用场景的长时间单目标跟踪任务的核心问题,提出新的模块设计和系统框架设计,同时对基础网络架构提出改进的训练方法,进一步的提高整体系统的性能,对相关研究进行了实验设计,完成实验并在权威测试数据集上验证系统性能。通过元学习结合MixUp[1]数据增强方法,提高特征提取骨架网络的性能。提出了 one-shot目标检测方法,解决目标丢失后再定位和再识别的问题。采用多短时跟踪器融合的方式提高跟踪的精度和对目标大小尺寸的适应性。通过级联回归方法提高了短时跟踪器的性能。实际时序记忆模块和在线更新模板模块作为目标再检测的验证器,提高跟踪系统对目标判别的鲁棒性。论文选择了最权威和具有挑战性的多个数据集,VOT2020-LT[2]、Lasot[3]、VOT2018[4],GOT10k进行了测试验证实验。实验结果表明本文模型在多个目标跟踪指标下都达到了当前具有竞争力的性能,本文提出的方法模型和系统具有应用和研究价值,可被广泛应用在安防,无人机,无线设备等领域的科研工作中。
其他文献
视频行为检测是指在视频中检测出包含行为的时间片段作为时序行为提案。现有工作主要分成两类:一类是利用视频的底层细节来生成行为提案,另一类是利用视频的高层语义来生成行为提案。然而,现有方法并未同时考虑视频的底层细节和高层语义来生成具有高覆盖率和高召回率的行为提案。为了生成更高质量的行为提案,本文提出了一种提案修正网络(Proposal Correction Network,PCN),包含候选提案的生成
现实生活中处处存在多目标优化问题,与单目标优化问题不同,这种问题通常涉及到多个互相冲突的优化目标。因此,多目标优化问题的解通常是一组互相折衷的解集。进化算法源于自然中生存进化的思想,由于其基于种群的性质而广泛应用于求解多目标优化问题。然而真实的优化问题往往涉及到并不简单的目标函数评估,如计算昂贵的数值模拟实验或物理实验。不幸的是,传统的进化算法并没有考虑到这一点,而是建立在直接进行目标函数评估的不
学位
背景 局麻药布比卡因(bupivacaine,bup)被广泛地应用于临床麻醉与镇痛,在临床上发挥着十分重要的作用。但是局麻药的神经毒性也给患者带来精神和身体上的困扰,严重制约着患者的生活质量。因此,由局麻药带来的这些问题也就十分值得麻醉医生及相关人员的重视。转录因子p53具有诱导细胞周期阻滞、促进DNA修复和凋亡,以修复或清除DNA损伤的功能,在很多真核生物的发生、发育、生长、代谢、疾病和衰老方面
目标检测是计算机视觉中的一项重要任务,它的作用在于将图像中的每个目标准确的定位并将它们正确地分类。在现有的目标检测领域中包括两个问题:一是在基于目标检测的特征的融合算法中忽略了各级特征之间的相关性而直接融合;二是在目标检测系统的落地应用中不能检测低光照和黑暗场景下的目标。在特征融合算法中,由于卷积神经网络的高层特征包含更多的语义信息而有助于分类,卷积神经网络的浅层特征包含更多细节信息而有助于定位的
作者身份归属,是指将作者身份未知的文本归属于某一候选作者的过程。事实证明,计算机和互联网的普及从根本上改变了人们的生活方式,也改变了我们产生和接收信息的方式。作者归属是将海量数据转化为实用知识的关键方法之一。通过研究语言痕迹的反映,作者的身份归因旨在揭示潜在作者的身份和社会语言特征。以风格技术为支撑的作者归属的进步对网络犯罪侦查、市场营销与社会网络分析、文学与科学教育等各个领域都产生了重大影响。为
学位
学位
随着计算机科学的快速进步,人工智能技术在很多领域的应用上都取得了突破,并迎来了新一轮的爆炸式发展。深度学习是人工智能相关领域中广受人们关注的研究热点。在深度学习中,神经网络起到提取特征的作用,而损失函数(loss function)起到监督结果和优化模型的作用,是神经网络模型中最重要的衡量指标之一。损失函数用来表示神经网络的输出和真实标签之间的差距,所以一般来说损失函数的值越小就代表着网络模型的输
学位