基于深度多任务学习的目标跟踪方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:binhuchen007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,视觉目标跟踪作为计算机视觉领域的研究热点,取得了越来越多的研究成果。已成功运用于视频监控中,并在智慧城市、交通管制、治安监控、安全检查等各方面得到实际应用。联合深度特征的滤波跟踪方法在视觉追踪中展现优异的性能,极大程度上推动目标追踪的研究发展。现有的诸多跟踪方法,仅简单利用目标的深度特征,分开处理目标深层语义信息特征,没有探索深度特征的关联性,限制了深度特征强大的表征能力,导致跟踪算法的鲁棒性不高。本文针对上述问题,开展了如下工作:(1)提出基于多任务深度耦合相关滤波器(MDDCF)跟踪方法。充分利用深度网络的多层次特征,将具有个体特征的目标表示作为单个任务,更好地探索不同深层特征之间的关联性。重新推导并提出目标函数的交替优化方法,联合训练相关滤波器和网络参数。使用一种有效的模型更新方案,有效地捕获目标外观变化。在多个基准数据集上的实验表明本方法能够有效应对目标遮挡、快速运动等属性。(2)提出联合目标检测的多任务卷积算子(MCOT)视觉跟踪方法。利用多任务学习技术探索连续深度特征之间的相关性,以优化卷积滤波器。使用一种结合加权滤波器的跟踪模型更新策略,将加权的滤波器集成到跟踪模型中,减少复杂参数更新次数,提升跟踪速度。在跟踪框架中引入目标检测网络应对目标丢失,提高跟踪方法的鲁棒性。在跟踪数据集上的实验表明本方法在目标长时间丢失、快速运动等属性上具有较好的性能。
其他文献
目标检测作为计算机视觉的重要研究领域,目前在无人驾驶,工业制造,智能医疗,安防等领域得到了广泛的应用。然而在目标检测中,因目标检测场景复杂,待检测目标尺寸存在较大差异,预测分支使用特征与检测任务所需特征不匹配等问题,导致检测网络精度较低的问题。本文针对目标检测网络中存在的上述问题,提出了基于多尺度特征融合和注意力机制的目标检测方法。本文主要工作如下:(1)目标检测任务中,针对待检测目标间存在较大尺
“创客”教育是国外首先提出的一种新型的教育模式,是未来教育改革与人才培养的趋势,在国外,Scratch编程作为信息技术课程被广大学生所喜爱。目前市场上大多是基于Scratch二次开发的可视化、积木式工具,而且大部分只能实现基础的动画、故事、数学等逻辑编程,无法支持后续的电子机械类课程的教学活动。例如北斗作为国家重要的战略新兴产业,很多创客教具不支持北斗芯片的运行,无法让北斗工程以简洁的积木块形式走
人体行为识别一直是智能视频分析领域的研究热点,近几年被广泛应用在虚拟现实、人机交互以及短视频拍摄等方面,具有重大研究意义。随着深度学习算法在计算机视觉中的快速发展,基于深度学习的行为识别算法层出不穷,研究者们从识别准确率、识别速度、模型结构等方面对行为识别算法进行创新,然而目前的行为识别算法在识别精度和网络模型复杂度上仍有改进的空间。得益于深度学习尤其是长短期记忆网络在行为识别领域中的高速发展,本
近年来,随着工业和信息化的深度融合,数字化经济的发展,信息物理系统(Cyber-Physical Systems,CPSs)作为新一代的智能系统受到了广泛的关注和研究。CPSs在实现远距离实时传感和动态控制的同时,也带来了安全性的问题。随着计算机控制网络的开放性日益增强,拒绝服务(Denial-of-Service,DoS)攻击通过阻断数据传输造成的网络带宽资源被占用等问题不容忽视。另外,CPSs
由虚拟现实技术发展而来的增强现实近年来被应用在了多个领域,如教育,医疗,工业维修等,其中将增强现实技术与手功能康复技术结合逐渐成为康复领域的研究热点。本文通过改进增强现实的注册算法设计出针对ADL(activities of daily living,日常生活能力)的康复方案:首先针对VSLAM(visual simultaneous localization and mapping,视觉同时定位
图像在拍摄过程中受天气(雾、雨雪、阴天)、运动、光照不足等影响加之拍摄硬件设备的限制,会产生严重的退化,造成细节丢失、亮度降低、颜色退化、模糊、辨识度降低等问题,为了提升图像的可识别度以及为后续开展检测、识别、跟踪、分类等,本文针对噪声和运动模糊造成的低质图像进行清晰化的研究。开展了基于各向异性扩散和三维块匹配算法相结合的噪声图像清晰化算法及基于DeblurGAN模型的运动模糊图像的清晰化算法,主
在图像处理领域中,块匹配方法是图像去噪与运动估计中的常用方法,其通过查询指定区域找出相似块,进行信息的比对与联合去噪,从而削弱不符合图片规律的噪声。其中,三维块匹配算法(BM3D)结合了空间域与频率域的若干种算法,是当前图像去噪效果最好的算法之一。本文以非局部均值算法为基础对图像去噪算法进行研究,主要研究工作如下:首先,针对三维块匹配算法计算耗时长,针对相似块提取不够准确、分割块内分布不同的相似特
学位
近些年来,由于计算机和通信设备在功耗、移动性和效率等方面取得的技术进步,信息物理系统应运而生并得到快速发展。但与此同时,信息网络与物理世界的强耦合也给工业界带来新的挑战,其中,最突出的问题是网络安全性和有限的信道带宽。由于开放性的通信平台,网络攻击频繁地入侵信息物理系统,导致系统无法正常运行。另一方面,在信息物理系统中,信息数据和控制信号通过网络传送到远端,可能会导致信道拥堵,无法满足系统实时性需
随着数字图像处理软件和计算机信息技术的迭代发展,人们可以随意篡改数字图像而不留下明显的视觉痕迹。经过篡改的图像或生成的虚假图像通过社交媒介的加速传播对个人隐私、日常生活甚至社会稳定产生严重的负面影响。因此,研究有效的图像伪造定位和检测算法变得愈加重要。针对图像复制-粘贴篡改,现有针对该篡改的定位算法Buster Net采用并行网络结构鉴别源/目标区域,并通过含有四层池化层的VGG16提取特征,从而