面向辅助驾驶的实时目标检测与追踪方法研究

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:cynthia0737
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在计算机视觉任务中的逐渐普及,多目标实时检测、模型优化、跨相机追踪等技术在各个领域的应用也愈发广泛。辅助驾驶作为目标检测的首要落地方向,已经成为当下的研究热点。但在某些复杂场景中依然存在一些问题,例如车辆过于密集导致检测的精度过低、模型内存大无法实时推理、跨相机追踪目标易丢失等。基于此,本研究以辅助驾驶为应用场景,对多目标的实时检测模型及优化、跨相机追踪等算法进行设计,实现速度与精度的有效均衡的同时,保持较强的普适性。本文的创新点如下:(1)在辅助驾驶的不同应用场景,例如商业堵塞区、人流高峰区等,容易发生漏检、误检。针对这一现象,本文提出基于Center Net多目标实时检测模型。首先,主干网络增加了CBNet的多融合阶梯级联结构,解决目标检测模型表征能力不足的问题;其次在原高斯核只考虑中心点与边界框距离的基础上,融合目标的长宽比率提出多样标准差,提高模型回归的精准性;最后直接回归函数融合边界框的尺度,加快网络收敛速度。本文结合自采数据与部分COCO数据,对比目前的主流检测算法,提高检测的精准率与召回率至90%,训练时间仅为原训练时间的20%。(2)针对检测模型结构越来越复杂、内存占用逐渐增大这一问题,本文提出基于Center Net多目标检测模型的混合压缩方法剪枝-蒸馏-finetune。残差分支增加注意力机制模块,漏斗分支进行通道剪枝,使用深度可分离思想进一步压缩参数量;引入助手网络、单独学习教师网络与学生网络的差异性;然后采用GHMloss优化匹配代价,加权损失函数提升精度。实验结果表明混合剪枝方法降低了80%的模型参数量,推理速度提升了50%;蒸馏finetune后,模型相比于finetune之前精准率提高了3%,召回率提高了2.8%。(3)为了解决车辆遭受遮挡出现的追踪漂移问题,本文基于siam rpn++提出了一种跨相机的多目标追踪算法。首先基于Mobile Net V2主干网络,提出Split Necks模块构成“多层次的轻量化骨架”,提高模型的学习能力;其次基于BFENet融合车辆外观信息与空间信息,设计IOU约束策略改进跟踪效果,提升赋予新目标ID的准确性。消融实验表明本文提出目标追踪算法MOTA达到89%,运行速度提升了35.7%。
其他文献
生物行为分析在神经学、药物学、疾病治疗和认知科学方面有着重要的研究意义。随着计算机视觉、图像处理和MEMS等检测技术的发展,生物行为自动分析系统的设计实现,可以大幅提高传统人工识别与分析方式的工作效率。本文以小鼠为实验对象,设计了一款基于多传感器信息融合的生物行为分析系统,重点研究基于视觉传感器小鼠行为分析中的图像预处理、目标检测、目标特征信息提取、小鼠运动参数计算等关键技术;以及基于IMU传感器
学位
作为一个纺织服装生产、出口、消费大国,中国纺织产业对质量检测提出了更高的要求,而传统的织物结构与外观分析测试方法难以满足现代纺织行业标准和需求,因此,亟需构建一套客观、精确、高效的织物结构以及外观分析系统,提升相关行业检测的效率和准确性。织物结构和外观的智能化分析,不仅是检测领域的难点,也是纺织工业智能化、数字化发展的研究热点。现有研究提出的客观分析方法大多是基于织物二维图像的,受织物纹理和颜色影
学位
随着互联网技术的快速发展,虚拟问答社区已成为了一种热门的知识服务平台,用户可以在其中提出问题或解答问题。为了增强知识共享,社区还为用户提供了输入内容查询相关答案的功能,但社区返回的查询结果通常只是一个与查询内容相关并且具有海量信息的问答列表,并且存在以下问题:查询结果中包含了大量的问答对,同时每一个问题下也包含了大量的答案,用户难以在有限时间内浏览完全部的答案;与此同时,不管是查询结果中的问答对、
学位
在线问答社区作为一种重要的知识共享平台,帮助越来越多的用户满足知识需求。随着问答社区中问答数据的持续积累,海量的问答数据造成了信息过载的问题,用户难以快速、准确地获取所需知识。在浏览问答文档时,为了更好地理解和掌握答案内容,用户通常需要浏览能够对当前答案中的内容进行解释的其他问答。用户的专业背景不同,对于解释性问答的需求也不完全相同。结合用户的个性化特征,向其提供个性化的解释性的问答,可以帮助用户
学位
随着社会的迅猛发展,人们开始越来越关注社会公共安全问题,在许多大型的公共场合都安装了监控摄像头,形成系统的监控网络。但随之而来面临着一个亟待解决的难题,就是在如此大量的数据中,如何高效、系统的筛选有用信息,传统的方式是依靠人工方式进行筛选信息、提取有用内容,这不仅费时费力、效率低下,关键在于人眼观测监控视频时间越长误判率越高,行人重识别(Person Re-identification,Re-ID
学位
长久以来,从共生角度探究水泥行业绿色低碳发展的研究主要集中在微观尺度上的案例研究,或宏观尺度上行业间的粗线条研究,缺乏在共生系统视角下,从企业水平估算应用共生手段所带来的绿色低碳发展潜力。另外,与水泥行业相关的产业共生和城市共生并非相互独立,水泥行业与城市之间的城市共生关系也应纳入共生系统。本研究基于中国水泥行业与钢铁冶炼行业、燃煤发电行业、城市污水处理部门及市政垃圾清运部门的发展现状,利用企业级
学位
在计算机视觉领域,三维重建是指物体或者场景表面的三维重建,是一种通过图像恢复物体或者场景外观和结构的一种技术。实现高精度的三维重建一直是机器人学和计算机视觉界追求的目标。三维重建是一个很宽泛的课题,多年来不同研究者面向图像、点云等,从重建的分辨率、重建的速度、多传感器融合的重建等不同方面对三维重建进行了研究。本文面向序列图像对三维重建中的图像深度、图像位姿以及重建过程中的关键帧选择展开了研究,整个
学位
贸易对经济发展起到了重要推动作用,带动了就业与收入增长,但贸易也引起了碳排放的转移。对减排责任的划分关系到各国经济发展空间,基于生产侧碳排放进行划分而忽视贸易隐含的碳排放转移可能不够全面,IPCC评估报告也越来越关注消费碳排放和贸易隐含碳转移。与此同时,欧盟已计划最早于今年提出征收碳边境调节税的详细提案,未来中国出口将面临边境碳调节的挑战。基于OECD全球投入产出模型,本文对贸易对经济与碳排放的影
学位
随着科技的发展,很多领域的应用对图像的要求越来越高,主要表现在清晰度,色彩,图片信息等。由于在特殊天气下,图像很多关键信息很难获取到,限制了进一步的图像应用。因此如何有效的对初始图像进行预处理,是一个具有研究价值的课题。本次研究是针对单幅图像的去雾算法,在基于大气散射模型下,通过改进透射率的计算方法和自适应的散射系数,在现存的去雾算法基础上,进一步优化了去雾效果。首先,本文从原理上分析了大气散射模
学位
石油行业对我国国民经济和能源安全有着非常重要的意义,本文基于我国2017年投入产出表编制了细化石油产业链特征的投入产出表,涵盖40个部门,其中石油部门13个,分别是上游部门1个(石油开采产品)、中游炼油部门6个(汽油、柴油、煤油、燃料油、石脑油、其他石油制品部门)、中游化工部门6个(乙烯、丙烯、PTA、聚乙烯、聚丙烯、其他化学产品部门)。应用研究的细化石油产业链特征的投入产出表,本文研究了石油行业
学位