智能驾驶中基于轻量化神经网络的多目标检测方法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jitic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年硬件的快速发展使得其计算能力不断提高,深度学习中新的神经网络算法的提出使得目标检测飞速发展,实时性和准确性都有了很大的提升。然而就车辆和行人多目标检测场景而言,第一模型依赖于强大的算力;第二模型在视频检测中相邻帧之间候选框会出现闪烁问题;第三模型在测试端会出现大量的冗余数据。这将为车辆和行人的检测的实际应用带来极大的困扰。因此,优化车辆和行人的检测算法对解决上述问题兼具理论和应用价值。针对以上问题,提出了基于轻量化神经网络的多目标检测方法(Ghost-DWBIFPN)。首先通过相应的数据集扩充技术对数据集进行扩充,并重新选择了稳定性更高的K-Means++算法进行聚类替换了原本的K-Means算法;其次对于模型较大和参数较多问题,对网络架构进行改造,以轻量化为目标,用Ghost Net改进主干网络,特征融合模块在融合效果出色的BIFPN基础之上进行改进,生成全新基于深度卷积的双向特征金字塔网络(DW-BIFPN),结合两部分的改进组合成全新的目标检测算法;然后针对逐帧处理的弊端,采用跳帧法来加速视频实时处理,针对视频检测中候选框闪烁问题,利用Deep SORT跟踪算法进行优化处理,并结合了跳帧法来效优化视频检测中的问题。最后针对城市道路交通场景,提出了一种利用车道线信息检测提取感兴趣区域的优化算法,实现了只在感兴趣区域的范围对进行车辆和行人检测方法。实验表明,改进的主干网络结构取得了较好的特征提取效果,最终的网络结构在网络参数上减少到大约10%的同时仍然得到较高的精度;利用Deep SORT算法优化了候选框闪烁现象;最后利用车道信息得到的感兴趣区域有效的将时间消耗降低了大约33%。
其他文献
随着国内经济水平的快速发展,人民的生活水平不断上升,各类企业的生产规模不断扩大,社会各处对电能的需求量也越来越大,同时电力系统的管理与调度也面临新的挑战。负荷预测是实现电力系统的管理与调度的基础性工作,潮流优化也是其中的重要一环。因此实现对未来负荷分布和大小的准确预测与实现潮流的最优化对电力系统的管理与调度具有重要意义。为了实现准确的时空负荷预测,提出了一种基于图神经网络与循环神经网络的时空负荷预
学位
在计算存储分离数据库中,数据库的输入输出(Input/Output,IO)瓶颈转向计算节点与存储节点之间的网络IO和存储节点的磁盘IO。缓存技术用来平衡CPU与IO之间的处理速度鸿沟。由于不同负载对缓存的需求不同,一成不变的缓存配置在不同负载下会存在影响性能和浪费资源的问题,因此需要根据不同负载对计算存储分离数据库中各节点的缓存进行参数配置,从而在合理利用资源的基础上提升节点提供服务的能力。通过对
学位
随着视频数据量的爆炸式增长,通过深度学习算法进行视频的分析渐渐变成了热门方向。本课题基于云服务构建了一套监控视频的分析系统。对视频分析的核心算法的处理主要有两个步骤。首先针对模型训练阶段,其中很多步骤需要人工干预,同时依赖专家经验。而自动机器学习可以使这些步骤自动的完成,同时得到性能良好的模型。本课题基于NNI的自动机器学习工具进行模型的自动超参数调优,同时在模型的推理阶段,基于Triton In
学位
随着航天技术和计算机技术的发展,遥感技术实现了蓬勃发展的趋势,怎么样对海量的遥感图像进行处理并且从中获取有效的信息,已经成为遥感领域的核心问题。在遥感领域中,对遥感图像的有效地物分割是遥感技术研究的基础,也是领域中的热点问题,因此从遥感图像中得到有效地物分割结果图是遥感技术发展的重中之重。基于深度学习的地物分割方法能够提取遥感图片中定位信息和语义信息,从而对遥感图片实现端到端的地物分割。采用深度学
学位
基于图像的三维重建是计算机视觉领域的一个重要研究方向,而多视图立体视觉作为其中最为高效鲁棒的方法,得到了非常广泛的研究。传统的多视图立体视觉通常可以重建出精度较高的模型,但是依赖于手工设计的特征描述子与代价函数,这难度较大并且处理效率通常不高。最近,一些基于深度学习的多视图立体视觉方法也展现出可以与传统方法相比较的重建质量。但是由于模型的复杂性,目前这些方法生成较低分辨率深度图的同时占用大量的显存
学位
随着科学技术的发展,人脸三维重建技术在计算机图形学领域越来越重要,该技术在人机交互、电影、3D游戏等领域有着广泛的应用。在虚拟人物的面部动画中,如何使人脸口型动作和语音保持同步一直是研究热点。为了重建出语音对应的口型,需要进行语音特征分析,口型特征分析和口型重建等过程。传统方法在重建口型时,无法在保证匹配精度的同时兼顾制作效率,这使得良好的口型动画制作过程效率低且成本高。本文对三维人脸的语音和口型
学位
随着现代社会计算机的不断发展,全行业信息化数字化进程的不断推进,图数据的规模也在不断增长。在如此庞大驳杂的图数据中如何提取有用的信息即图挖掘则具有着重要的意义。并且,社交网络的兴起也促使图数据内各种社区的形成,而在其中挖掘出具有特定特征的社区,很多情况下更是NP难问题,不易设计出高效算法。同时,图数据内,时态图因其特殊的时间属性,逐渐代替传统的普通图,成为了社区搜寻领域活跃的研究对象。极大持久社区
学位
图是一种较为复杂的数据结构,在计算机科学中,图是由顶点和边构成的集合。在实际的生活中,常使用图数据结构来描述数据间的关系。诸如网页之间的链接关系,蛋白质分子的组成,社交网络关系等,都是通过图数据结构的形式呈现。作为数据挖掘领域中的一部分,图数据挖掘在这些年引起了广泛的关注。随着图数据规模的不断增大,用户需要一个系统用于对图进行管理和挖掘。因此,如何设计一个高效的图数据挖掘系统,已成为当下研究的重点
学位
随着互联网的不断发展,社交网络用户越来越多,人们日益热衷于参与各种社交网络活动。因此,如何从多个社交网络中找出其中的相同用户是一个非常有价值的工作,这一任务在跨网络推荐、敏感人群定位等各种工作中都体现着很重要的价值,这一任务也被称为网络对齐。当前网络对齐的解决方法一般分为两步:一、社交网络嵌入:因为社交网络是一个非常复杂的结构,直接在社交网络上执行计算是非常困难的。因此,通常先将网络嵌入到一个低维
学位
卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习(Deep Learning,DL)最重要的算法之一,采用权值共享的网络结构,降低了网络的复杂度,被广泛应用于计算机视觉等领域。传统的卷积神经网络主要基于中央处理器(Central Processing Unit,CPU)或图型处理器(Graphics Processing Unit,GPU)进行实现。目
学位