基于光流网络与孪生网络融合的行人目标跟踪算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:elfer_hfut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会智能化发展飞快,公共场所监控摄像头越来越普及,相应的基于监控视频的行人目标跟踪技术也有着广泛的应用前景。近年来,深度学习迅猛发展,基于深度学习的目标跟踪算法性能也提升了不少,但在实际应用场景下,仍存在着许多挑战。本文对目标跟踪挑战中的相似物干扰以及目标遮挡挑战进行了深入分析,以行人为主要跟踪目标,提出了基于光流预测的孪生网络目标跟踪算法,以解决部分跟踪挑战,进而提升目标跟踪算法的鲁棒性。本文研究的主要内容如下:本文算法将光流网络(Flow Net)与孪生(Siamese)网络相融合,以实现在相似物干扰以及遮挡情况下仍有高跟踪精确率的目标跟踪算法。首先通过光流网络提取被搜索图像帧和其上一帧图像间的运动信息生成稠密光流图,并回归得到目标预测区域,裁剪出预测区域的图像块,输入轻量级孪生网络中的搜索分支,使得孪生网络跟踪算法在目标可能出现的区域通过相似度进行跟踪,达到防止图中其他区域的相似物对跟踪算法形成干扰的目的,解决了目标被相似物干扰的问题。接着通过光流网络提取的光流信息结合相似度阈值对目标变更与否进行判断,当预测目标与模板目标相似度值低于相似度阈值时,复用光流网络提取的光流图,对目标位置前后两帧间的两个光流矢量进行比对,当光流矢量差高于一个阈值时,判定目标发生了错误变更,并进行目标修正。通过前后两帧间的光流信息重新选取后一帧中有着相似光流矢量以及高相似度的对象作为预测目标,完成对跟踪目标的修正。更好地应对了目标被大部分遮挡及被相似物部分遮挡情况下易发生目标错误变更的问题。本文采用轻量级的卷积神经网络作为孪生网络的骨干网络,多次使用1×1的卷积核压缩通道数量,降低参数数量,在提升跟踪算法的计算速度的同时使得孪生网络的泛化能力也得以提升,并将第三层卷积层和第五层卷积层提取的卷积特征相融合,丰富卷积特征,从而进一步地提升本文跟踪算法的性能。本文算法在加利福尼亚大学提出的OTB(Object Tracking Benchmark)数据集进行实验验证。实验结果表明,本文算法能有效解决在相似物干扰以及目标遮挡挑战场景下,跟踪目标易发生错误变更的问题,本文算法在OTB遮挡挑战视频图像序列下跟踪精确率达到了0.830,成功率图的曲线下面积(Area Under the Curve,AUC)达到了0.635,相比核相关滤波(Kernel Correlation Filter,KCF)算法成功率图的AUC值和精确率分别提升了18.7%和26.9%。本文将光流网络与孪生网络相融合进行目标跟踪,较大地提升了目标跟踪算法在相似物干扰挑战及目标遮挡挑战场景下的跟踪性能。
其他文献
钛及钛合金材料具有比强度高、疲劳强度高和生物相容性好等性能优势,已经广泛地应用在航空航天、军事和医疗等领域。相比传统的制造技术,金属增材制造(3D打印)技术可以成形结构复杂且性能优异的零件。TC4合金粉末是目前主流的金属增材制造技术原材料,粉末的性能对成形件的缺陷和性能均会产生影响,为保证增材制造钛合金成形件的质量,TC4合金粉末需要满足球形度高、形貌好和粒径小等特点。现阶段,电极感应熔炼气雾化(
在中国制造2025计划的推动下,信息物理融合系统(CPS,Cyber-Physical Systems)成为当前智能制造和工业数字化、信息化的重要研究热点。分布式架构的CPS拥有大量异构设备,这些异构设备每时每刻产生大量的时序数据,这些数据通过有线网络、无线网络和本地网关等进行数据传输,如何对它们进行实时采集、传输和监控是关系到企业管理高效性和变化适应性响的关键问题。现有监控系统存在数据采集协议不
知识抽取可以将半结构化和非结构化的文本类数据转化为结构化的数据,为构建知识图谱,问答系统,知识库建立等自然语言处理领域的子任务所使用。而在现实应用中,知识抽取面临许多的挑战,一方面对于中文命名实体识别(NER)任务,只有非常少量的标注数据。中文命名实体识别和汉语分词(CWS)任务有许多相似的词边界。每个任务中也有特定的特性。然而,现有的中文命名实体识别方法要么没有充分利用语料中的词边界信息,要么无
近年来集成电路技术的快速发展,导致电子元件逐渐向微型化,低功耗,智能化方向靠近。对于电子表面贴装行业来说,元件贴装难度也越来越高,贴片机作为表面贴装技术的核心设备,它的贴装效率以及精度要求也更加严格。为了进一步提高贴片机视觉定位算法的精度可靠性,本文通过分析国内外的贴片机发展以及视觉定位算法的研究现状,了解到目前国内定位算法的精度和稳定性较差,容易受到目标环境等干扰。为此本文以提高定位算法的可靠性
随着信息技术的加速发展,信息阻塞也越来越严重,用户对所需信息的需求质量也随之提高,这成为了当下急需解决的问题。随着推荐系统的应运而生,学术界和工业界在此领域也进行了广泛研究。但当前的信息推荐,使各个领域内信息互相匹配且相似的内容与用户所需要的信息内容结果相比还不太理想,且对于推荐给用户所真正需要的资源还需要精准和完善。所以,眼下怎样令用户得到合理化和个性化的资源是推荐算法的主要研究目标。本文针对这
如今人们的生活被互联网包围,网络设备需要不间断地运行以满足终端用户的需求,每时每刻都有大量的数据通过公共和私有网络与网络设备进行交换,但互联网与网络设备的开放连接访问在大多数日常网络活动中带来了网络安全威胁。网络入侵检测系统是一种可靠高效的保障网络安全的技术,但目前的网络入侵检测系统仍存在面对不均衡样本时检测的准确率低误报率高的问题,本文研究的基于神经网络模型的网络入侵检测具有重要的理论意义和应用
真实感流体模拟的目标是获得物理真实、视觉细节丰富的流体动画。欧拉网格法是实现真实感流体模拟的经典方法,并随着近年数据驱动技术的兴起受到进一步重视。然而,欧拉网格法的求解过程存在难以避免的精度损失,造成流体细节丢失,降低了模拟质量,影响模拟流体动画的视觉效果。尽管直接提高模拟分辨率能改善模拟精度,但这同时也引起了计算开销的大幅增长。因此,如何在保证性能的同时,适当补偿求解过程中的精度损失,从而增强模
微纳结构因其优异的性能而具有巨大的应用潜力。微纳米纤维作为众多微纳结构中的一种,可以通过多种工艺制造,其中离心纺丝因其产量大和能耗低等突出的优势吸引了越来越多研究人员的关注。离心纺丝作为一种制造微纳米纤维的新工艺,其工作原理是利用离心力将液态聚合物甩出拉伸细化而形成纤维。本文工作以探索离心纺丝的工艺参数为核心展开,包括装置的研发、工艺参数的探索、应用初探和装置的改进与验证。首先开展的工作是设计并构
作为图像和视频中的主要表现对象,研究让机器自动从图像和视频中识别人体的动作行为,具有非常重要的研究价值,也一直计算机视觉研究领域的热点问题。人体行为识别研究在视频监控、医疗保健、智能家居和人机交互等方面具有广泛的应用前景。人体的动作表现,主要是由骨架和关节点间相互牵引协作共同完成,因此人的骨架关节图中包含丰富的动作特征信息,并且骨架信息对尺度、光照和视角等变化具有很强的鲁棒性。在视频流任务中,时序
随着计算机视觉研究和工业生产技术的发展,现实场景感知技术已经在自动驾驶、室内机器人导航、场景识别等人工智能应用领域中得到广泛使用,其中语义分割技术是现实场景感知的关键步骤,它是指对场景数据进行逐元素的分类。以往的语义分割研究大多是面向图像的,而采用三维扫描设备采集的点云则是继图像视频等数据之后出现的新型数据,其包含更丰富的场景信息,目前面向点云的特征提取和语义分割已成为计算机视觉领域中的研究热点。