基于深度学习与相关滤波的在线跟踪算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:ding_zh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术的发展,视频监控在智能安防、企业生产、智能交通中发挥着越来越重要的作用。为了解决跟踪过程中行人的多尺度变化给跟踪带来的影响,本文针对在线目标跟踪算法开展研究,采用多个相关滤波器辅助跟踪,制定滤波器之间的辅助和约束关系以解决多尺度跟踪问题,采用深度学习特征与边缘检测特征融合得到更加丰富的特征,使得目标跟踪算法性能得到提升,课题研究内容具有积极的意义。针对目标检测算法,本文提出了基于Light-Head R-CNN算法的改进方法。检测算法需要较高的检测精度和速度,目前的一阶段检测算法和二阶段检测算法的检测精度和速度较为理想,但在保证速度的前提下,较小目标的检测效果有待提升。本文提出了将待检测目标场景的目标大小聚类、设置合适大小候选框的方法,提升了检测算法对小目标的检测能力。通过尝试不同的训练策略,提升了检测算法的检测精度,对复杂场景下的较小的行人检测有较好的检测效果。在特征的使用上,本文对卷积神经网络特征与边缘检测的融合进行了研究。在分析了卷积神经网络的组成单元、工作原理、前向传播和反向传播理论、网路训练策略后,进行了网络特征的可视化,提出了卷积神经网络特征与Canny特征融合方法。在孪生网络跟踪算法上获得良好的实验效果之后,本文将其用于基于相关滤波的跟踪算法,取得了很好的效果。在跟踪算法上,本文提出了基于KCF算法的改进算法。改进之处主要包括三个方面:针对多尺度目标跟踪,提出了多个滤波器相互辅助解决多尺度目标跟踪方法,通过在第一帧同时训练行人头部、臀部和身体躯干滤波器,同时设置滤波器间的辅助约束以尽可能多的利用目标信息辅助跟踪,然后通过确定头部和臀部滤波器的跟踪结果的距离确定目标的尺度,从而修改目标框的尺寸;针对搜索目标框的范围为固定值时,跟踪过程中目标发生尺度变化时有无法搜索到目标的情况,提出根据多个相关滤波器的距离设置了可变的padding范围,使跟踪过程中的滤波器有合适大小的目标搜索区域;在一定范围内搜索目标框时,提出了更为高效的二阶段搜索方式,可以一定程度上减少跟踪过程中的时间消耗。根据VOT2016的部分行人数据集上的测试结果,本文改进后算法的平均重叠期望(EAO)达到了 0.208。最后,对本课题所开展的研究工作进行了总结,并展望了未来的研究方向。
其他文献
纺织业是长三角地区历史悠久的传统手工业,历经了盛衰起伏的发展历程,形成了独特的纺织生产和产业变迁的模式和路径,是中华历史文明的重要组成部分。尤其近代以后,上海、杭州更是成为我国重要的纺织生产基地,在其纺织工业发展过程中留存下来的关联建筑遗产承载了该地区纺织业的发展演化和历史变迁,具有重要的遗产价值。本研究依托于国自然课题、浙江省文物保护科技课题,立足于沪杭地区近现代纺织工业遗产创新性保护策略营构,
糖尿病视网膜病变检测是当前医学图像处理领域的研究热点之一。对于众多糖尿病患者而言,及早的检测到视网膜病变并进行治疗是控制病情发展的关键,正因如此本文主要研究早期的红色病灶检测。红色病灶由于与背景颜色相近对比度低,血管等组织结构以及眼底图像成像干扰等原因而难以被检测,传统的检测方法主要依赖手工提取特征对候选区域进行分类,存在手工特征描述能力不足的问题。本文主要基于卷积神经网络进行病灶检测算法的研究,
作为核聚变反应器托卡马克装置的首选结构性材料,低活化钢的力学性能一直是影响核聚变工程实验堆建设的关键性因素。本论文以低活化钢为原型进行成分、热机械处理、热处理工艺的设计,以调控钢种微观组织中的位错密度、马氏体block、析出相M23C6和MX,旨在实现低活化钢常规力学性能的提升,然后通过组织性能的分析指导低活化钢的进一步发展。为在保证强度的前提下提高低活化钢的韧性,首先通过成分和工艺的耦合设计优化
时滞系统的状态的变化不仅仅依赖于系统当前的状态,也依赖于过去某一时刻的状态.时滞系统的稳定性是当前一个热点问题,在电路、光学、生物医学等领域备受关注.既有的研究方法中,新频域扫描框架基于解析曲线,可以检测出系统的临界虚根,临界虚根的渐近行为可以由频域扫描曲线来判断,但这种方法在实际操作过程中对人力的要求比较大,在处理规模较大的系统时并不适用.扫描得到的结果也存在数值计算上的必然误差.在计算机等辅助
汽车作为当今世界不可或缺的交通工具,其安全性一直是人们关注的焦点。而这些焦点之一便是安全带的可靠性。因此,为了更好地设计安全带,碰撞试验应运而生。当汽车发生突然碰撞时,安全带的高度调节器上部导向环(D环)处会出现织带集中现象,使得乘客胸部受到的局部正压力突然加大,造成人体胸部严重伤害,这是由于汽车碰撞过程中安全带受到胸部拉力的作用,安全带产生横向位移且导向环受力运动,因此横向位移参数的可靠性研究对
目标检测和语义分割作为无人驾驶计算机视觉领域中的两个基本问题,应该说,在无人驾驶场景理解方面,是无人驾驶车辆应该具备的基本能力。前者的核心任务是将视野范围内不同类别的目标识别并定位出来;后者进行的是像素级的分割,相比前者,针对单个目标的操作更加细腻,更加精准,同时也更加复杂。对于无人驾驶车辆和机器人的场景理解来说,目标检测和语义分割的研究意义重大。针对这两个任务,本论文的主要内容可以从以下几个方面
目标检测作为装甲车辆环视态势感知系统的关键技术,可有效提高装甲车辆内乘员的观测能力和其应对潜在威胁的能力。基于深度学习的目标检测算法在配备高性能显卡的服务器上可以达到实时性、准确性的要求,然而面对装甲车的战场应用环境,配备高性能显卡服务器和使用网络远程连接服务器的解决方案均不具备现实可行性。因此,本文研究基于嵌入式平台的深度学习实时目标检测,解决基于深度卷积神经网络的目标检测算法在嵌入式平台无法满
近年来,随着环境污染问题的日益严重,有机污染物的治理问题备受瞩目。半导体光催化技术是一种新型绿色无污染环境治理技术,相比传统的有机污染物治理方法,该技术成本较低、不存在二次污染。钒酸铋(BiVO4)、钼酸铋(Bi2MoO6)和钨酸铋(Bi2WO6)是三种光催化性能良好的新型铋系半导体光催化材料,但是仍然存在可见光响应范围较窄和电子-空穴对复合率较高等问题,因此,对铋系材料的改性研究受到众多学者的广
香菇是中国特色农产品之一,也是河北省最具优势的菇种,针对目前鲜香菇人工分级成本高、自动化分级程度低等产业问题,本研究基于机器视觉技术设计了一套鲜香菇自动分级系统,实现鲜香菇自动上料、间歇输送、单体化、姿态翻转、等级分类识别和分级功能。主要内容如下:(1)对比分析了鲜香菇分级标准,确定以颜色、形状、菇帽直径(大小)和开伞度4个指标对鲜香菇进行等级分类。采样不同批次生产的鲜香菇,测得鲜香菇样品的菇帽直
四环素类抗生素是一种广谱类抗生素,它会通过食物链流入水体和土壤环境中,间接危害人类健康。因此,寻找一个高效监测环境中抗生素的方法十分必要。薄膜扩散梯度技术(Diffusive Gradients in Thin-Films technique,DGT)是一种可以定量测定水中金属离子、有机物等浓度的原位监测技术,采用可渗入离子的薄膜或水凝胶将结合相与本体溶液隔开,控制离子交换,进行现场定量分离累积。