基于深度学习的移动目标视觉跟踪及应用研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:jinlong230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和人工智能技术的不断发展,信息化、智能化成为当今世界的主题。在计算机视觉领域,由于深度学习的崛起使得目标检测和跟踪技术准确率大大提升,进一步扩展了其应用场景。而无人机作为灵活高效的空中无人平台,极适用于城市安全监控。基于此,从无人机视角进行目标检测和跟踪具有深刻的社会意义,同时也是本课题的重要立足点。本文以无人机视觉系统为研究对象,并以人为主要目标对检测算法、跟踪算法及双目测距算法进行研究,研究内容如下:(1)本文提出了基于Mobile Net的多目标跟踪算法。借助于Mobile Net深度可分离卷积能够对深度网络模型进行压缩的原理,将YOLOv3的主干网络替换为Mobile Net,通过将标准卷积分解为深度卷积和逐点卷积,并保留多尺度预测部分,以有效减少参数量。对于检测得到的边框信息,利用Deep-SORT算法进行跟踪。通过仿真及无人机实验平台验证,表明该方法在跟踪效果基本不变的情况下,可提升处理速度近50%。(2)本文针对遮挡问题,在核化相关滤波器(Kernel Correlation Filter,KCF)的基础上提出KCF和深度学习检测相结合的改进算法。首先,使用峰值旁瓣比和响应峰值判断是否出现遮挡,若遮挡严重,则启动深度学习重检测机制;否则,使用KCF进行跟踪。其中,检测算法基于YOLOv3,在替换主干网络为Mobile Net的同时,使用深度可分离卷积并引入空间金字塔池化,提高检测算法准确率。使用OTB2015数据集对跟踪算法进行评测,结果表明本文提出的算法在跟踪成功率和准确率上相比KCF算法分别提高了9.5%和3.3%。同时,通过仿真及无人机实验平台验证,表明该改进算法在保证快速性的前提下,提高了算法抗遮挡能力。(3)本文为使检测算法达到实时性要求,利用Tensor RT对模型进行推理加速,并基于检测算法的结果,采用半全局块匹配(Semi-global block matching,SGBM)算法得到视差图,根据双目立体视觉原理实现双目测距。为减小背景影响,将检测得到的边框向内缩减三分之一,通过室内外测距实验结果显示,本文所使用的测距方法基本满足实验需求,在8米内测距误差在6%左右。将Tensor RT用于Jetson TX2平台,检测算法实时性可达21fps,达到了实验所需的实时性。
其他文献
深度脑刺激(Deep brain stimulation,DBS)是目前治疗帕金森、特发性震颤等运动障碍疾病的有效手段,其通过向病灶区施加高频脉冲刺激来缓解症状。影响DBS效果的主要因素是刺激的波形、频率、幅值及个体差异等,构建闭环DBS是解决上述问题的最优策略。为此,本文开发了一种兼容开闭环设定、多波形发生的多模式DBS装置,实现刺激波形优化及闭环调节。同时,搭建基于模型的DBS实验系统,模拟在
学位
多相永磁同步电机因其具有低压大功率输出能力、可靠性高和转矩脉动小等优点,在工业领域中应用越来越广泛。在多种电机控制策略中,有限集模型预测控制由于具有多约束处理能力、脉冲输出方式简单、动态响应快等优点,成为多相永磁同步电机驱动系统控制策略的研究热点之一。但是相较于三相永磁同步电机,多相永磁同步电机相数增多,模型更加复杂,导致有限集模型预测控制存在计算量大,复杂度高的问题。针对以上两个问题,本文以双三
学位
新冠肺炎(COVID-19)疫情期间在线教育使用者激增,庞大的音视频流量给网络基础设施带来了巨大冲击。如何在有限的带宽条件下提升音视频流畅度具有重要意义。针对此,本文研究基于超分辨率技术的低码率音视频重建方法,通过超分辨率方法将低采样率音视频重建为高采样率音视频。由于现有的重建方法难以满足高质量在线教育音视频的需求,本文使用外部参考引导的方式使重建音视频更加真实。在视频超分辨率方面,为了满足低时延
学位
石油开采难度随着油田储油量的减少不断升级,为更准确的监控采集信息,多相流传感技术也随之不断发展。测量参数的增加使井下仪器需要采集的信息更丰富。随着数据传输量不断增加,对传输数据的正确性也提出了越来越高的要求。对于整个测井系统的发展,数据传输部分至关重要,且单芯电缆作为测井数据传输介质可用传输带宽有限,在井下温度和压力的影响下数据传输的误符号率(Symbol Error Rate,SER)难以保障。
学位
室内布局估计是计算机视觉领域的研究热点之一,是室内场景理解的一个重要基础任务,其目的是根据室内场景图像还原出室内的几何结构。室内布局估计在机器人室内导航与定位、增强现实和室内场景三维重建等方面具有广泛的应用前景。室内布局估计问题面临着室内物体繁杂、平面边缘遮挡及物体表面纹理复杂等问题的挑战。目前的室内布局估计方法大多基于单一全局特征,且需要复杂的前处理或后处理过程,准确度一般,实时性较差。针对这些
学位
电阻抗层析成像(Electrical Impedance Tomography,EIT)具有非侵入、无辐射、价格低廉等优点,在形状规则、介质分布简单的场域重建中有良好的重建效果。由于其存在病态性、非线性,其对于生物组织等复杂场域的重建图像质量有待提高。超声检测方法同样存在非侵入、无辐射等优点,同时其敏感场特性与EIT互补,综合两种模态各自的优点,通过双模态融合方法可以提高复杂场域重建图像的质量。课
学位
油水两相流流动现象广泛存在于自然界和工业生产过程中,目前,中国低产低渗油田开采长期采用二次注水技术,已总体进入以低流速高含水为主要特征的中晚期开采阶段。以水为连续相的高含水油水两相流相间滑脱效应显著,受流型影响,分散相呈非均匀分布,管道截面油水浓度和速度分布不均匀,且不同区域的注水采集导致水相矿化度差异较大,对动态油井持水率测量提出新的考验。传统低频电学方法测量精度有限,需探索新的持水率测量方法。
学位
静电层析成像技术(Electrostatic tomography,EST)是一种面向气固两相流中分布参数测量的技术,具有成本低、非接触测量等优点,为解决气固两相流测量问题提供了一种有效方法。本文主要工作内容如下:1.静电传感器前端放大电路可以分为电流敏感与电荷敏感两种类型,两种类型的前端放大电路结构相似,但是电路参数的选择缺少定量依据。本文针对此问题,以信号形状相似程度作为衡量前端放大电路输出形
学位
空天往返飞行器具有快速、高效的特点,可大幅度降低航天运输费用,并且可作为战略轰炸机和远程截击机使用,在军事领域具有非常重要的研究价值。但是由于其研发过程有周期长、造价高、风险大等缺点,导致实物研究难度极大。为了降低空天往返飞行器研发过程中的成本、缩短研发周期,本文搭建了面向空天往返飞行器的虚拟仿真平台,用以对其研发过程中的理论算法部分进行仿真验证,主要研究内容包括:(1)为开发平台的仿真实时性功能
学位
<正>庚子鼠年,荆楚大地新冠肺炎疫情肆虐,地处湖北省东部的黄冈市一度成为除武汉以外疫情最严重的地区。为切实保障全市人民群众的生命安全,黄冈市委、市政府当机立断、快速行动,举全市之力投入这场没有硝烟、看不见敌人的战争,医护人员冲锋在前、党员干部下沉一线、志愿团队爱心支援,在黄冈大地上演绎出一曲曲气壮山河、感人肺腑的抗疫之歌。黄冈市委统
期刊