基于分割的目标跟踪算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:neppat8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪是计算机视觉领域的一个重要研究方向,其任务是给定视频序列中首帧目标的尺寸和位置,在后续视频帧中持续输出目标的状态信息。随着近年来计算机视觉技术的发展,目标跟踪技术已经被广泛应用到众多领域,如智能安防、无人驾驶、虚拟现实等。但目前目标跟踪任务仍面临目标快速形变、非刚性形变、尺度变换、前景-背景判别等难题和挑战,导致复杂场景下无法对目标进行准确鲁棒地跟踪。本文针对上述问题,提出了两种基于深度孪生网络结构的目标跟踪模型,解决了目标非刚性形变和多尺度等问题,整体提高了跟踪的准确性和鲁棒性。本文的主要研究工作如下:针对目标的快速形变、非刚性形变导致的跟踪任务准确率较低的问题,提出了一种基于掩膜信息的在线更新目标跟踪算法。该算法将整个目标跟踪任务主要划分为目标定位和分割跟踪两个子任务。首先,在目标定位任务中使用在线更新参数的机制对目标进行鲁棒定位以适应不断变化的复杂场景;其次,在分割跟踪任务中构建精确的目标掩膜信息分割子网络,保持鲁棒定位目标的同时精确得到目标的掩膜信息,以解决目标的快速形变和非刚性形变问题;最后,利用得到的目标掩膜信息生成包裹目标的旋转边界框。针对目标跟踪任务的多尺度问题和前景-背景判别问题,提出了一种基于自适应特征融合和混合域注意力机制的目标跟踪算法。首先,针对目标的多尺度问题,在骨干特征提取网络加入了自适应特征融合模块,用于更好地融合不同层级的主干特征,使提取的特征具有多尺度特性;其次,提出了混合域自注意力模块,采用非局部均值的思想在通道和空间分别进行自注意力操作,增强了特征的判别性,改善了跟踪器的跟踪漂移问题。将所提模型在GOT-10K数据集进行验证,实验结果表明所提模型显著提升了跟踪器的性能,平均重叠率指标AO达到了0.654,相对于最先进的跟踪器Pr DIMP(CVPR2020)提升了1.8个百分点,表明了本算法较高的有效性。
其他文献
视频直播、短视频业务的蓬勃发展在丰富人们日常生活的同时,也导致了数据流量爆炸式增长。为了提升用户体验质量,边缘缓存技术将内容提前缓存在离用户较近的边缘节点中,降低用户请求响应时延。由于用户兴趣的时变性和视频内容的多样性,如何精确感知用户的兴趣变化和内容的流行趋势成为实现高效边缘缓存所面临的关键挑战。推荐系统技术能够基于海量数据分析用户个性化用户偏好,为用户提供“千人千面的”的个性化推荐服务。因此,
学位
为解决南京椴种子萌发难的问题,本文研究不同赤霉素浓度、不同温度层积对其萌发特性的影响。结果表明,层积与赤霉素相结合是提高南京椴种子发芽率、促进幼苗发育的一种有效的方法,其中采用1 400 mg/L赤霉素浸泡24 h,经过4℃低温层积7 d,再转入10℃低温层积7 d,可显著提高南京椴种子发芽率,最高达73.68%;1200 mg/L赤霉素处理后经过变温层积和1 400 mg/L赤霉素处理后经过低温
期刊
近几年来,由于物联网等新兴技术的蓬勃发展,将会有更多的移动设备加入到无线网络中,构建智能美好生活是未来发展的大趋势。面对智能移动设备的爆炸式增长,使得频谱资源变得越来越稀缺,因此要求通信系统具备高传输速率以及高传输质量等特点。超宽带(Ultra Wideband,UWB)技术作为一种凭借极窄的脉冲来传输数据的技术,具有高带宽、多径分辨力强以及成本低等优点,主要用到室内短距离通信中,成为未来无线通信
学位
日益增长的全球电动汽车(EV)市场对锂离子电池电极材料的成本和能量密度提出了更高的要求。在现有的正极材料中,高镍层状Li NixCoyMn1-x-yO2(NCM)和Li NixCoyAl1-x-yO2(NCA)因较高的理论比容量和满意的工作电压,被认为是最有前景的电动汽车正极材料之一。然而,由于钴(Co)资源匮乏及价格昂贵,对电池行业所追求的低成本和可持续的目标构成了重大挑战,于是低钴或无钴化成为
学位
大数据时代,视频数据量在不断增加,视频编码技术也在不断发展。实际应用中H.264和高效视频编码(High efficiency video coding,HEVC)标准共同存在,通用视频编码(Versatile Video Coding,VVC)标准也逐渐登上历史舞台。由于不同编码标准的编码器在以后很长一段时间都会共存,这使得视频转码技术的研究十分具有意义。现存的视频转码算法常存在编码复杂度高和压
学位
人脸表情识别作为情感研究的重要组成部分,是实现人与机器交互的必要条件,具有重要的研究意义及潜在的商业价值。本论文就人脸表情识别过程中两个重要环节进行了分析,分析了现有的人脸表情特征提取算法以及人脸表情分类识别方法中存在的不完善的地方,并且提出了解决方案。本文研究的主要内容有:1.针对局部梯度二值模式(Local Gradient Binary Pattern,LGBP)只能在单尺度模板下提取人脸表
学位
通信信号调制类型识别是一种典型的模式识别问题,被广泛应用于信号确认、无线电侦听、电子对抗、信号监测和分析等领域。在通信环境日益密集,信号调制类型日益丰富的情况下,信号的调制识别变得愈加困难。近年来,随着机器学习的快速发展,深度学习算法在模式识别领域得到广泛应用,并逐渐用于解决信号调制识别问题。本文主要研究基于深度学习的信号调制识别算法,主要内容如下:1.针对现有方案在低信噪比环境下识别准确率较低的
学位
随着科技的发展,各行各业对钢材的需求量不仅越来越大,而且对质量的要求也是越来越高。精确测量钢水的温度可以提高钢铸工件的合格率,降低燃料成本,是推动钢铁自动化生产必不可缺的一步。目前通常采用红外测温技术全面监测冶炼炉中的钢水温度。但由于生产现场环境复杂,工作过程中受到环境温湿度、测温距离、发射率和粉尘等多种因素的影响,限制了测温精度。因此,本文将针对主要的影响因素,提出有效的温度补偿方法,以提高红外
学位
随着4G的全面普及和5G的加快部署,各种互联网新兴应用层出不穷。作为集中式无线接入网的核心部分,传统的移动前传面临着成本、传输速率和频谱利用率等方面的挑战。基于模拟光载无线的高效移动前传具有低成本、高传输速率和高频谱利用率等优势,已成为国内外专家学者的研究热点。为了便于高效移动前传中系统设备的控制和管理,以及与通用公共无线接口的背向兼容性,控制字与无线信号需要进行同步传输。当前,业界主要采用的基于
学位
随着人机交互技术的飞速发展,人们越来越注重机器人情感状态对整个交互过程的影响,重点关注机器人的情感响应过程和情感引导过程。以增强机器人在交互过程中的情感计算能力为目的,赋予机器人独特、主动的特点使其能够对参与人的输入情感进行响应并引导参与人情感向目标情感逐步过渡。该文先介绍机器人情感计算(Affective Computing,AC),然后针对实现机器人情感响应和对参与人情感引导的问题,构建不同的
学位