基于改进孪生神经网络的目标跟踪算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:tangwu2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能高速发展的今天,对于运动目标的跟踪问题成为了当下研究的热点,在视频监控、虚拟现实、人机交互、图像理解、无人驾驶等方面均有着广泛的应用。尽管已经取得了诸多进展,但是由于光照变化、遮挡、变形等多方因素的影响,目标跟踪依然是一项待研究和优化的项目。深度学习的发展引发了人工智能的第三次浪潮,伴随目前我们所能处理数据规模的扩大,深度学习为目标跟踪做出了突出贡献。在目前主流的跟踪算法中,基于孪生网络(Siamese network)的目标跟踪算法发展迅速,成为了与主流的相关滤波算法相匹敌的研究方向。本文针对近年来孪生网络在目标跟踪领域的发展,以解决复杂条件下(干扰、遮挡、光强变化等)跟踪、目标运动和形状多变等诸多挑战为目标,主要研究内容如下:(1)对目前基于孪生网络的目标跟踪算法进行深入的探究,通过多个对比实验与分析,根据实验结果得出算法的优缺点。针对现有算法的缺点,从网络结构构造与损失函数确立两个方面进行分析,主要针对目标形变和场景中的强干扰所带来的挑战,引入了一种在线更新机制,并对其进行了进一步的优化;(2)本文以孪生网络 Siamese-RPN(Siamese Region Proposal Network)为基础框架进行改进,提出一种基于在线更新机制的孪生网络跟踪算法,对其损失函数进行优化,以解决当下算法由于没有在线更新机制而引发的抗干扰能力较差等问题,并搭建一个具有预测判别能力的目标跟踪系统。通过利用各大数据集进行离线训练与在线追踪,与当今主流算法进行对比,进一步验证本文算法的有效性;(3)针对引入在线更新的目标跟踪算法特征表达能力较弱及跟踪速率较慢的缺点进行进一步的优化,为孪生网络加入双注意力机制,通过通道注意力和空间注意力的双作用,提高网络的特征表达能力,完善在线更新机制所带来的抗强干扰能力较差等问题。进而在保证跟踪准确率的同时,增强算法的鲁棒性,同时也提高了跟踪速度;(4)通过多组对比实验进行分析与总结,利用多个数据集和多种算法,从不同维度进行实验。从数据集OTB2015中分别挑选具有不同类别干扰(遮挡、目标尺度变化、运动模糊等)的视频序列进行测试,并对算法优缺点进行详细总结,提出未来可行的研究方向。
其他文献
随着社会的日益发展,人们面临的大气环境污染问题日益严峻,而挥发性有机物是造成大气污染的主要原因,当空气中VOC气体超过一定浓度后,将会损坏人体的健康,因此开发出快速、稳定的VOC气体传感器具有重要意义。在众多气体敏感材料中,基于金属氧化物半导体的气敏传感器具有制作简单、高灵敏度、响应和恢复速度快和成本较低等优点引起了广大科研工作者的极大关注,成为了近年来气体检测方向的一个研究热点。已知,基于金属氧
学位
受空气中悬浮颗粒的散射作用,雾霾天气下获取的图像会出现整体清晰度不足、信息丢失等问题,限制了图像在生产和生活中的各个领域中发挥其应有的作用。图像去雾技术可以显著改善雾霾图像的视觉效果,有着重要的研究意义。此外,随着深度学习技术的不断发展,构建强大的数据集以满足训练图像去雾网络的需求也显得尤为重要。综合以上背景,本文从以下三个方面开展了研究工作:(1)研究了基于雾气浓度量化模型的图像去雾算法。本文根
学位
在传统生产调度研究中,假设机器一直可用,而实际中机器由于使用而逐渐磨损,使得生产效率降低,甚至发生故障。预维护虽然能够降低故障发生率,提高机器的性能,延长其使用寿命,但也会占用资源,因而维护与生产分开考虑将引发调度冲突。生产与维护集成调度问题以其协调性受到越来越多学者的重视,尤其是随着状态监测技术的发展,基于状态的预维护与生产集成调度问题逐渐成为研究的热点问题之一。本文分别以最大完工时间和总完工时
学位
随着大规模摄像机网络在各大城市中的部署,公安部门能够获取海量的图像与视频数据。然而,通过人工的方式进行图像与视频分析需要付出大量的时间以及人力。行人搜索算法从场景图片或视频帧中对特定行人进行搜索,能够大幅降低人工查找带来的时间成本与人力成本。但是,当前端到端的行人搜索算法没有针对行人图像的外形特点做调整。同时,检测与重识别的任务的差异性也会使端到端的行人搜索模型的检测性能与重识别性能的下降。本文根
学位
近年来,时间银行作为一种新兴的志愿服务时间储蓄机构,在科学研究与社会实践中受到广泛关注。时间银行是由卡恩提出的一种有偿志愿服务模式,其内涵是将志愿者的公益服务时间记录下来存储到时间银行,待到需要时再取出来使用。由于我国社会逐步进入老龄化,时间银行模式主要应用于社区互助养老领域,该模式不仅可以提高公民的社交能力,而且能有效地缓解社会与国家的养老压力。但是,随着志愿者与需求者数量的不断增加,时间银行传
学位
在AR/VR、无人驾驶和移动服务机器人等领域,SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)技术有着广泛的应用。基于单目视觉的SLAM技术无法获得环境的绝对尺度且对环境的要求较高,而IMU(惯性测量单元)能够提供绝对的尺度信息,对于动态场景、快速运动等复杂的情况具有很高的适应性,与单目视觉在性能上具有很强的互补性。为了保障系统的准确性、实
学位
近些年来,随着科学技术的发展以及城市中监控系统的大规模普及,社会和个人的安全问题得到了日益重视。监控视频作为公众安全领域最重要的手段之一,在智能安防、人机交互以及商场导购等领域扮演着重要角色。然而,面对海量的监控视频数据,仅仅依靠人工监督的方式不仅消耗大量的人力资源,也极有可能遗漏掉关键信息,延误破案时机,给人民群众的生命财产造成巨大损失。因此使用计算机来高效、准确的搜索行人的重识别技术应运而生。
学位
智能监控系统在社会与国家安全中具有重要地位。基于监控视频的群体异常检测是智能视频监控领域一个代表性问题,同时也是计算机视觉与机器学习交叉领域的研究热点之一。其中,基于深度学习的群体异常检测方法由于其泛化性能好、计算速度快、适应性强等优势成为该方向研究的主要方法之一。本文依托于群体异常检测的研究背景,以深度学习的方法作为切入点,采用基于误差图特征的检测方法,针对视频群体异常检测问题开展了研究工作,具
学位
车辆重识别作为计算机视觉和重识别领域的一个重要分支,近年来受到越来越多的研究者关注。主要原因是我国拥有车辆人口的比例不断增加,交通管理部门面临的挑战越来越大。为此,政府出台了一系列相关政策,旨在促进智慧城市、智能交通的发展,车辆重识别因此受到了越来越多的研究者关注。得益于人脸识别和行人重识别的多年研究,其中的大量方法对车辆重识别都有很大的借鉴意义。但由于车辆的纹理信息匮乏,姿态变化剧烈,再加上有大
学位
光斑图是多模光纤中各个模式经过互相干涉之后在光纤端面形成的远场图,具有抗电磁干扰、耐腐蚀性以及体积小等优点。由于外界环境发生变化时,多模光纤中每个模式的相位都会发生变化,这使得光纤光斑图对外界环境变化十分敏感;而且多模光纤中模式相位的变化是所有模式变化的叠加,因此它被广泛应用于微位移测量、微应变测量等传感领域。随着光纤制备技术和光斑图采集处理技术的不断发展,研究人员研制出了很多模式数更多、性能更好
学位