基于MDNet的视频目标跟踪算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lnln0923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪技术作为计算机视觉领域的研究内容之一,在各个领域都有着广泛的应用。目前已经提出了许多基于卷积神经网络(CNN)的跟踪器,此外能够捕获顺序数据之间的长期依赖关系的递归神经网络(RNN)也被引入到了计算机视觉领域。多域卷积神经网络(MDNet)是一种基于多域CNN架构的在线跟踪方法,它对候选区域进行采样,通过在大规模数据集上预训练CNN,并在测试视频的第一帧微调。但由于该算法中每个候选者都是独立处理的,因此在时间和空间方面具有很高的计算复杂度,其算法的运行速度较慢。另外,MDNet是基于CNN建立并将跟踪任务视为分类问题,其重点主要集中在类间分类上,而在存在干扰物的情况下,MDNet很有可能将对象和背景进行错误分类。本文就针对MDNet存在的这两点进行研究,并提出一种新的基于MDNet的跟踪算法,本文主要工作从以下几个方面展开:(1)基于RoI Align的网络结构改进:原始MDNet在提取被跟踪目标特征时是先产生候选区域,然后用候选区域在原图上扣图提取特征,导致计算复杂度较高。针对该问题,本文提出了新的算法MD-RA,采用RoI Align特征提取方式,使用双线性插值加快特征提取速度。由于RoI Align自身在提取特征时比较粗糙而丢掉一些有用信息,故MD-RA在使用RoI Align时根据前后RoI宽度重新调整RoI Align计算时单元大小。另外,通过移除最大池化层,使用扩张卷积的方法增大特征图上每个点感受野的方法来增强特征图的表达能力。本文改进后使得MD-RA在OPE精度和成功率上相比于MDNet降低了3.3%和1.6%,但是在跟踪速度上提升了大约9.2倍。(2)在MDNet的基础之上融合RNN特征:MDNet是基于CNN建立的,存在类似目标对结果产生较大干扰的问题,而RNN可以在序列数据中捕获目标前后帧的长期依赖关系。针对该问题,本文引入RNN对目标物体的自身结构信息进行建模,然后融合被跟踪目标物体的RNN特征和CNN特征,以此加强跟踪网络对被跟踪目标与类似干扰物之间的判别能力。(3)损失函数的改进:原始MDNet中只有一项二分类损失,抗干扰能力较弱。针对该问题,本文引入一个新损失项,该损失项的作用是让在不同域中的目标在共享特征空间中彼此远离,并且能够在新测试序列中学习在当前域中看不见的目标对象的判别表示,以此来提高MDNet对类似干扰物的鉴别能力。在上述改进的基础上,提出了新算法IMP-MD。通过实验验证,IMP-MD在OPE精度和成功率上相比于MD-RA提升了3.7%和2.0%,在速度上相比于MDNet提升了7.8倍,具有较高的应用价值。
其他文献
海南省委、省政府以信息技术为基础,大力推动海南省信息产业的发展,使海南省信息产业得以全面提升。
按照国务院《关予推进兽医管理体制改革的若干意见》精神,根据成都市委、市政府《关于深化我市乡(镇)机构改革的意见》要求,我市金堂县于2004年10月撤销了乡镇畜牧兽医站.将乡镇畜
保护草地生态就是保护人类自己。“牧草”是发展生态畜牧业和建设社会主义新农村的重要物质基础,是生产无污染绿色畜产品的重要原料,是绿色“黄金”,是推动生态畜牧业发展和社会
通过浮选实验、溶液化学计算、吸附量测试、动电位和红外光谱分析等方法,系统研究了油酸钠对微细粒黑钨矿的浮选捕收机理.结果表明:黑钨矿可浮性与油酸钠吸附量正相关,微细粒
(接上期)1.2.4.17检疫书证类型及适用范围.根据<动物检疫管理办法>的规定,动物检疫(许可)分为产地检疫、屠宰检疫(许可)二种;许可证明有以下几种签发形式:产地检疫和出具<产
设计了一种计算分数阶微积分的髙精度数值算法,提出了一种构造生成函数的简便方法.分析了基于快速Fourier变换的算法,该算法误差较大的原因是应用了不准确的生成函数的系数,
由于精神分裂症早期干预可提高临床疗效,对精神分裂症超高危人群的研究已成为热点。虽然已取得较大研究进展,但在临床干预方面面临挑战。中医药干预有优势但研究不足。文章拟
音乐是一门听觉的艺术,时间的艺术,情感的艺术。音乐通过语言和旋律的有机结合,直接地抒发人们的内心情感,开辟一个崇高的精神境界。声乐有着很强的表现力,但要达到感染听众
为探究厌氧氨氧化(ANAMMOX)过程中微生物群落结构的演化,采用高通量测序技术对ANAMMOX反应器中微生物群落结构进行分析.结果表明:反应器运行61 d后氮去除负荷达到1.04 kg&#183;N
在三维欧氏空间中,主法线曲面作为特殊的非可展直纹面具有良好的代数和几何性质.运用微分几何的方法研究主法线曲面的结构函数.根据三维欧氏空间中不可展直纹面的定义和标准