自动驾驶目标检测的轻量化实时网络设计

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jshaczcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动驾驶汽车控制系统是一种自主决策系统,它主要处理来自车载雷达和视觉检测传感器的观测流。目前基于车载雷达的目标检测技术已经相对成熟,为了完善整套自动驾驶系统,对于卷积神经网络的视觉检测性能要求也在不断提高。在视觉检测领域,已经出现了众多高精度的目标检测网络,例如YOLO等网络,但这类网络结构复杂度高,无法有效地嵌入到小型处理器中进行实时使用。在自动驾驶的视觉系统中,车载雷达摄像头的处理器属于小型处理器,推理能力有限,无法应用传统的高精度目标检测网络。为了满足目标检测网络能够嵌入至小型处理器,并有效地完成目标检测任务,目标检测网络结构需要在保证一定准确率的情况下,将检测模型不断地向小型化轻量化推进。本文将研究重点放在轻量化双阶段网络结构的搭建,致力于在移动端完成对目标的实时检测。本文通过搭建轻量化双阶段网络结构对目标进行实时检测,主要完成了如下任务:1)研究了目标检测网络的算法原理和训练过程,分析当下比较流行的目标检测网络结构,总结出了这些算法中存在的性能限制;2)针对轻量化网络的高效性、准确性和稳定性三个方面设计轻量化模型。在高效性上设计显著性分组卷积,将特征图分为多个子空间,降低计算量,增强通道间有效信息的流动性。考虑在低复杂度的情况下,提升准确率,设计适用于轻量级分类网络的多层分组感知器,可在指定结构中替代深度可分离卷积操作。针对SGD优化器在轻量化模型训练过程中出现的收敛性能不稳定问题,设计了基于横向标准化的SGD优化器,训练过程中准确率和目标函数都达到设计要求;3)搭建基于双阶段的轻量化实时目标检测网络。网络不单结合单阶段检测网络的实时性和双阶段网络的高准确性,还结合了浅层网络位置信息丰富和深层网络特征区分度高的特点。网络中引入RPN网络,结合前景和背景的信息来优化特征分布,在较低的计算量下得到一个高效的目标检测网络;4)扩充VOC数据集中行人遮挡等特殊图片,验证Ours目标检测网络和跟踪算法结合后的性能,将目标检测网络嵌入至移动端,完成对目标的实时检测。通过与目前已知目标检测网络的性能指标进行对比,本文基于双阶段的轻量化实时目标检测网络可以在移动端达到较优的检测性能。
其他文献
随着我国信息社会的发展以及移动互联网的迅猛普及,社会中各类资讯信息与互联网的结合更加密切。借助互联网,信息可以在短时间内通过多种传播渠道分发给大量网民。以网络作为媒介,社会舆情可以更迅速、更具体地表现在网络空间中,形成网络舆情。网络舆情是新时代的产物,它的表达方式在具备自由性和互动性的同时也存在误导性和突发性。正确地利用网络舆情信息,充分地发挥其正面影响有利于形成积极健康的舆情氛围,维护社会和谐稳
随着互联网、物联网的日益普及以及各种网络技术和在线应用的提出和使用,对网络带宽的需求越来越大,未来对数字信息的需求将超过目前光通信系统的最大能力。这对作为骨干网的光纤传输技术提出巨大挑战。一方面要保证高可靠,另一方面又要保证大容量。为了平衡这两点,必须利用适合的光学性能监测(Optical Performance Monitoring,OPM)技术对光纤传输物理层参数进行监控,以实现资源的灵活调配
近年来,随着网络应用的迅猛增长,无线自组织网络中的路由协议应该增强自适应性,要既能够满足业务的传输需求,也要降低路由机制的复杂性,节省路由开销,更加高效地利用有限的网络资源。目前,传统的路由协议按路由的发现策略可以分为表驱动路由和按需路由。其中,表驱动路由因为需要网络中参与路由的节点掌握全局的网络拓扑信息,会带来较大的网络负载。而按需路由由于在数据报文传输前要进行一次寻路的操作,会带来较大的时延。
智能体是指通过对环境进行感知,并利用既有知识或者自身不断迭代的策略,与环境进行交互,完成指定任务的个体系统。而多个这样的智能体可以组成一个多智能体系统,可以解决单个智能体能力受限的问题。随着人工智能的发展,强化学习技术常应用在智能体建模上,尤其是深度强化学习可以增强智能体的感知、学习、决策能力。同时,多智能体之间的协作也会提高整体系统的能力上限,可以处理更为复杂的任务。但是,目前基于深度强化学习的
根据世界卫生组织统计,全球每年因交通事故而带来的伤亡高达上百万,由此可以看出车辆行驶安全的重要性,而智能交通系统将先进技术(人工智能、通信等)运用于交通运输系统中,可以提高系统的效率和安全性。随着近几年深度学习的发展,把深度学习技术用于智能交通系统行驶安全的相关研究越来越多,其中基于深度学习的轨迹预测就是一个很典型的例子,把轨迹预测用于轨迹异常检测和碰撞预警,对于车辆行驶安全有着重要的意义,然而,
深度学习技术在近几十年来得到高速发展,这一技术随即被应用在越来越多的领域中,自然语言处理也有诸多研究方向可以使用深度学习,文本生成就是重要方向之一。文本生成是一项基础性研究,能够在许多实际场景落地,例如提取文本摘要、文本风格转换、文本自动纠错等。生成对抗网络是深度学习中一个备受关注的框架模型,现有的文本序列模型都具有数据离散的特点,将生成对抗网络直接应用于文本生成时,就会面临训练过程中无法通过反向
辐射源个体识别对于公共安全和军事电子对抗等领域有重大意义。随着现代信息科技的不断发展和各式电子设备的不断普及,空间中的电磁环境日益复杂,复杂的电磁环境给辐射源个体识别带来特征提取困难问题,同时也引发了对未知辐射源个体进行判别的需求。为解决这些问题,本文对辐射源个体识别系统的主要模块以及未知判别方法展开研究。其中识别系统的主要模块包括数据预处理、特征提取和神经网络模型,本文对其各模块的不同方法进行了
命名实体识别是自然语言处理技术中的基础任务。作为转化非结构化文本数据的关键步骤和重要手段,命名实体识别在信息提取、问答系统、文本分类等任务中都有着重要作用。尽管命名实体识别技术发展逐渐完善,但是在进行中文命名实体识别任务时仍存在以下问题:(1)数据集获取困难,没有统一规范的处理模板;(2)预处理阶段考虑字词特征不充分,忽略上下文的语义信息;(3)无法有效识别嵌套实体。因此,如何进一步提高中文命名实
在一些图像存储和传输资源有限的情况下,图像一般需要经过比特深度重量化来满足资源要求,随后再经过比特深度重建来生成原始比特深度的图像。其中图像比特深度重建技术旨在解决比特深度重量化给图像带来的伪轮廓和颜色失真问题,但对于重量化导致的图像结构信息丢失却没有办法重建。而现阶段的比特深度重建技术又只单一地针对低位截断这一简单的比特深度重量化方式进行图像重建,这严重地限制了最终的重建图像质量。本文主要围绕图
随着移动互联网的高速发展,人们对基于定位追踪的位置服务需求也日益增长。现有的卫星定位技术只在没有障碍物遮挡的室外环境中适用,而难以在复杂的室内环境中提供准确的位置信息。为此许多学者提出了大量基于不同传感器的室内定位方法。但现有的室内定位方法普遍存在一个问题,即观测到的传感器数量和种类会随着时间变化而不断改变,使得定位样本和指纹库中样本维度异构,从而造成定位误差的增加。迁移学习能够从一个域中学习知识