【摘 要】
:
目标跟踪作为计算机视觉的一个重要分支,在众多领域中发挥着重要作用,其中包括:视频监控、无人机视觉导航、自动驾驶、医学成像、军事制导等。目标跟踪的主要任务是训练获得一个跟踪器,在给定视频第一帧图像中待跟踪目标的位置的情况下,通过跟踪器准确地预测出该目标在后续帧图像中的位置。随着人工智能浪潮的兴起,越来越多的国内外学者投身于目标跟踪领域,大量能够完成目标跟踪任务的算法被提出,但是由于存在背景相似干扰、
【基金项目】
:
国家自然科学基金(No. 61977052);
论文部分内容阅读
目标跟踪作为计算机视觉的一个重要分支,在众多领域中发挥着重要作用,其中包括:视频监控、无人机视觉导航、自动驾驶、医学成像、军事制导等。目标跟踪的主要任务是训练获得一个跟踪器,在给定视频第一帧图像中待跟踪目标的位置的情况下,通过跟踪器准确地预测出该目标在后续帧图像中的位置。随着人工智能浪潮的兴起,越来越多的国内外学者投身于目标跟踪领域,大量能够完成目标跟踪任务的算法被提出,但是由于存在背景相似干扰、形变、光照变化、尺度变化、运动模糊、遮挡等问题,准确地完成目标跟踪任务仍然面临巨大挑战。本文对基于孪生网络的目标跟踪算法进行研究,主要成果有:(1)提出一种基于自适应更新的孪生特征网络目标跟踪方法。针对所选用的骨干网络主要适用于目标分类任务的问题,构建目标感知模型,利用目标损失函数和尺度损失函数优化模型参数,根据反向传播时的梯度决定特征图中每个通道的重要性,从而筛选出适用于目标跟踪任务的典型性特征;针对目标可能发生尺度变化等问题,引入自适应更新模型,通过视频序列当前帧图像的深度特征与模板特征的相似程度指导孪生网络模板的更新,提高了算法应对目标发生尺度变化等问题的能力,使得跟踪结果更加稳定和准确。实验中将该算法移植到嵌入式系统,也获得了较为准确的跟踪结果。(2)提出一种基于下残差交叉特征的孪生网络目标跟踪方法。针对骨干网络深度较浅的问题,构建由下残差模型组成的骨干网络,利用裁切等方式缓解卷积层中零填充操作对网络平移不变性的影响,增加骨干网络的深度以提高模型对特征的表达能力,同时限制骨干网络的总步长,减小感受野过大对跟踪准确度的影响;针对待跟踪目标的匹配问题,融入交叉特征模型,利用三个不同尺度的卷积核获取目标的交叉特征,使得模型能够获取不同尺度目标的深度特征,从而提高模型的匹配能力,提升模型的跟踪效果。(3)提出一种基于特征融合评估的孪生网络目标跟踪算法。针对特征提取网络不同层次特征包含不同信息的问题,引入特征融合模型,将获取的低层特征与高层特征进行融合,使得融合后的特征同时包含低层信息和高层的语义信息,让模型能够适应更广泛的跟踪场景;针对预设锚会对跟踪结果产生影响的问题,构建特征评估模型,将目标跟踪任务看作回归任务和分类任务的结合,分类任务将输入图像中的目标区域看作正样本,背景区域看作负样本,回归任务在分类为正的位置直接回归目标的矩形框,避免先验信息对跟踪结果的影响,并且通过得分评估机制筛选掉得分较低的矩形框,从而提高跟踪精度。
其他文献
频扫天线相较于相控阵天线,在满足扫描范围的条件下,节省了多个T/R组件,具有成本低、结构简单、容易实现小型化等优点;但频扫天线实现宽角度扫描时传输损耗也较大,两者相互矛盾。针对目前无人机“黑飞”对国家和社会安全带来严重威胁的问题,本文设计了一款用于“低慢小”目标监视雷达的宽角度频扫天线并生产加工出来用于实际工程,实现了对目标角度的测量。介绍了频扫阵列天线的基本理论和波导缝隙天线的辐射原理、多种辐射
推荐系统可以在海量数据中迅速发现用户喜欢的信息,已广泛应用于很多领域。传统的推荐系统根据预测评分的高低将推荐状态分为“推荐”或“不推荐”,这种二支的分类忽略了推荐过程中产生的成本问题;其次,传统的推荐系统没有充分挖掘和利用评分数据的价值,使推荐受到数据稀疏性的影响,难以学习用户的偏好;另外,在传统的推荐系统中,只关注项目与项目之间的相似性关联,即正关联,而忽略了项目与项目之间的负关联。形式概念分析
多目标优化问题广泛存在于工业制造、生产生活中,随着科技的发展和社会的进步,多目标优化问题呈现出大规模的特点。大规模多目标优化问题在车站的路径规划、供水系统规划等场景有重要的应用。尽管多目标优化算法的成果很丰硕,但是对于大规模多目标优化问题的研究还不成熟。大规模多目标优化问题的显著特点是决策变量空间的维度较大,影响了解的搜索效率。本文针对大规模多目标优化问题,主要研究以下几点:1.将高维决策变量空间
伴随着信息爆炸,推荐系统应运而生,其中核心的算法部分主要分为三块,分别是召回、排序和重排模块,在这里最为重要的是排序模块,在排序中关注最多的指标是点击率(Click Through Rate,CTR)和转化率(Conversion Rate,CVR),相对于CTR,CVR问题存在数据稀疏和样本选择偏差的问题,数据稀疏指的是训练时CVR数据规模上远远小于CTR数据,样本选择偏差指的是CVR的训练空间
基于实在法的视角,可以从规范的逻辑结构、识别步骤、适用情形和形成过程四个方面对一般法律原则和习惯国际法进行区分。从规范的逻辑结构来看,一般法律原则只能以原则的形式出现,具有程度较高的抽象特征;而习惯国际法通常以规则或原则的形式出现。从规范的识别步骤来看,识别一般法律原则首先需要满足"世界主要法律体系共有"的要求,其次符合"被移置于国际法体系适用"的条件;识别习惯国际法需要同时满足"国家实践"的物质
图像描述生成任务用一句通俗的话解释就是“看图说话”。人类快速地浏览一幅图像,就可以辨认并描述出图像中关于视觉场景的大量细节。然而,这种非凡的能力对计算机而言是一个极具挑战的任务。图像描述生成任务是一个典型的从视觉到文字的跨模态任务,其基础是图像内容理解和文本生成。具体来说,此任务首先对图像内容进行分析得到图像特征;然后基于已获得的图像特征生成相对应的文本描述。判断图像包含哪些内容并控制描述语句的生
纤维增强复合材料制品凭借其自身质量轻、强度大、耐腐蚀、可设计强等突出特点,使其在航天航空、船舶、军工、石油化工、汽车行业等领域获得广泛应用。纤维缠绕机是生产纤维增强复合材料制品的核心设备之一。纤维缠绕机按一定纤维缠绕规律将纤维增强复合材料缠绕在组合回转体表面上生产出纤维增强复合材料制品。因此纤维缠绕规律和按照纤维缠绕规律运动的纤维缠绕机运动轨迹成为纤维缠绕成型技术的关键。与之对应的针对纤维缠绕规律
人体姿态估计任务是计算机视觉任务的热点之一,主要包括对图像或者视频中的人体和人体关键点的准确定位,进而估计恢复出人体姿态的任务。在运动建模、监控安防、行为动作分析和人机互动等领域,人体姿态估计都具有广泛的应用价值。在实际生活中,受拥挤人群遮挡、光线因素变化以及各种复杂场景等的影响,人体姿态估计一直存在着一些普遍和典型的问题和挑战。基于这些问题和挑战,本文在学习总结了相关领域知识方法的基础上,利用深
随着国民经济水平的不断提升,人们的出行方式逐渐演变为以汽车为主。但由于道路规划不合理以及人为主动性地交通违规等原因,道路交通安全问题越来越严重,比如违规停车、违规驾驶等交通违规现象日益增加,轻则造成交通拥堵,重则导致交通瘫痪甚至发生大型交通事故危及群众生命安全。车牌号作为车辆的“身份证”,能唯一地标识车辆,车牌在交通违规中标识车辆具有重要作用,因而准确而快速地识别车牌号码在当今的交通场景下的应用非