基于长短时记忆的孪生神经网络目标跟踪方法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:mgpd141314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪技术是计算机视觉领域的一个研究热点,有着重要的研究意义,在视频监控和无人驾驶等许多领域都有着广泛的应用前景。尽管目标跟踪技术已经取得了较大的进展,但由于跟踪任务的复杂多变,存在很多如遮挡、背景干扰和外观变化等影响跟踪算法性能的因素,设计一个精确度高、实时性好且鲁棒的跟踪算法仍然是一个巨大的挑战。近年来基于孪生神经网络的跟踪算法发展迅速,在VOT等挑战赛中取得了不错的成绩,这些算法具有实时性好的优势,但是其泛化性能较差,鲁棒性不强,当目标外观出现大的变化时会使算法的跟踪性能变差。针对上述问题,本文在孪生神经网络的基础上引入了长短时记忆网络(LSTM),重点研究了跟踪算法的特征学习、相似性度量、模型更新以及网络训练。本文主要工作总结如下:(1)提出了基于鲁棒特征表示的孪生神经网络跟踪算法(SMT)。该算法通过相似度度量的方法来匹配目标对象和候选区域,在孪生网络的基础上增加区域提出层来生成候选区域,卷积层使用特征提取能力更强的VGG网络,利用层次化的特征让目标对象有丰富的特征表示,同时增加长短时记忆层来用于跟踪,并在模板更新时引入置信决策方法。长短时记忆层的作用在于通过其内部结构的记忆单元和门机制来存储和更新特征信息,使得获得的特征向量鲁棒性更强。实验结果表明提出的算法在快速运动、背景干扰、运动模糊、旋转变化和尺度变化等多个属性下与其他8个具有代表性的跟踪算法相比具有更好的鲁棒性和精确度。(2)提出了基于联合外观和运动信息的孪生神经网络实时跟踪算法(SMT-R),网络结构分为包含目标外观信息的卷积层、保存和更新运动信息的长短时记忆层和输出目标位置坐标的回归层。该算法在卷积层中提取目标外观信息,并通过将运动信息合并到网络模型中,使得跟踪算法能够修改目标模型并适应新的对象,在长短时记忆网络中记忆单元是在前向传播的过程中更新的,使网络可以不断接受当前的信息并进行快速的信息更新,从而能够在跟踪过程中通过长短时记忆网络学习和更新目标对象的运动特征,避免了在跟踪过程中进行反向传播,减少了跟踪过程中的计算量,从而提升运行速度,使其可以应用于实际的生活场景。实验表明,提出的算法能够以实时的速度运行,并且具有良好的跟踪精确度。
其他文献
人体姿态估计是图像分析和行为识别的重要基础,通过对图像中人体关节点位置的检测,用于后续对图像内容的辅助理解。随着电子设备的不断智能化,人体的行为分析越来越多的被用
附在基材上的导电薄膜(导电涂层)被广泛应用于抗静电、电磁屏蔽、金属防防腐蚀以及电子设备等领域。然而,目前石墨烯基导电涂层在制备过程中往往需要用到合成树脂类材料做胶
摆动转子压缩机是滚动转子压缩机的孪生结构,随着制冷工质的发展,研究人员发现摆动转子压缩机具有承受更大压力差的优点,比滚动转子压缩机具有更明显的优势,因此在部分空调压
喇嘛甸油田一类油层聚合物驱已全面转入后续水驱,2007年10月开始,通过对二类油层高浓度聚合物驱的推广,通过对油水井近几年的油水井精细调整和实践,我厂北东块几个二类油层高
共轭亚油酸(Conjugated linoleic acid,CLA)是一系列具有共轭双键的十八碳二烯酸。作为一种新型的具有广泛生物活性的功能性脂肪酸而备受关注。目前,CLA的规模化生产主要利用
随着互联网技术的普遍与发展,世界进入了信息爆炸时代,计算并分析大规模密集型科学数据已成为数据挖掘的新趋势,而文本挖掘作为数据挖掘的主要方面,也已经成为知识发现的新方
近年来,随着城市化进程的快速发展,城市规模逐渐扩大、人口数量迅速增加导致了水资源供需矛盾日益突出。地表水和地下水污染、水资源空间分布不均匀和全球气候变化引起的干旱
压裂技术是低渗透油田增加单井产量,保证油田产量稳定,并从中提高经济效益的一项重要措施。他拉哈地区油藏具有油层埋藏深、油层物性比较差、丰度比较低、小层发育多、每个单
近年来互联网的快速发展,人们每天都能接触到大量的文本,信息爆炸式增长产生了海量的数据。面对这些海量的文本数据,如何快速的浏览和选择所需要的内容,有效的节约阅读时间已
S油田P区块东、西两翼油水过渡带开发面积较大,地质储量占整个P区块地质储量的16.65%。70年代开始陆续采用300-400米不同注采井距的面积井网投入开发。目前过渡带地区经过整