基于特征重用的神经网络交通环境目标检测

来源 :吉林大学 | 被引量 : 0次 | 上传用户:tfnpfije
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通环境中的目标检测是辅助驾驶、自动驾驶系统中必不可少的组成部分,基于深度学习的目标检测是当前计算机视觉领域最热门的研究方向之一。本文在国家重点研发计划项目(2016YFB0101102)“电动汽车智能辅助驾驶技术研发及产业化”的资助下,研究如何通过基于神经网络的目标检测方法来实现不论何种工况下,均能够利用车载相机检测出动态目标的位置和类别信息。针对基于神经网络的交通环境目标检测方法展开研究,为平衡目标检测方法的实时性和准确性,从数据集获取及处理、网络结构搭建及优化、损失函数、训练方案设计等多角度对当前最热门的目标检测算法YOLOv3做出了改进,并与其他主流的目标检测算法进行了对比。本文完成的工作如下:第一,为尽可能满足深度学习神经网络训练时对数据量的要求,本文采用COCO数据集训练网络模型,样本数据输入训练之前采用随机裁剪、填充、翻转、旋转、混合等多种数据增强方法,将原数据量扩充为3~5倍,并相应调整真实标注信息。调整后的标注信息使用k-means算法分为9类,取每一簇的聚类中心,得到本文所需的锚框anchor,用于后续的网络训练。第二,针对YOLOv3算法特征提取网络的缺点,本文设计了改进的DB-Net网络,主要的改进为特征重用的层连接方式,为了进一步预防网络在训练过程出现梯度爆炸、梯度消失现象,加入模块残差结构。同时,为了提高网络的运行效率,灵活加入1*1核尺寸的卷积层用于数据降维和还原,并采用深度可分离卷积替换普通卷积。本文发现YOLOv3对于目标尺寸超过图片宽高百分之五十或者目标尺寸占原图比小于百分之七时的检测结果不够理想,因此本文利用空间金字塔池化搭建了感受野变化模块,增强预测器对目标尺寸的探测范围,达到提升检测率的效果。第三,YOLOv3中将目标的中心坐标和边界框宽高分开并采用不同的损失函数原型进行训练的方式,使得目标信息的关联性较差,并且平方差损失函数对尺度不敏感,在一定程度上会影响检测性能。针对以上问题本文使用CIOU损失函数计算定位信息计算,并且为了改善难检样本问题,本文采用Focal loss作为置信度损失函数。最后,本文基于Windows10、Python3.6、Tensorflow、Keras开发环境,对设计的DB-Net性能改进进行实验研究,与主流的网络结构Res Net、Darknet-53进行了对比实验分析,并替换不同的损失函数,复现多种目标检测算法验证了本文方法的优越性,另外,本文还测试了多种复杂工况的检测效果,验证了本文方法的鲁棒性。
其他文献
目的:急性冠脉综合征(Acute coronary syndrome,ACS)是最常见的心血管急危重症。及时诊断ACS有助于改善患者预后以及降低心血管病死亡率。然而,现有的ACS诊断标志物存在缺陷,难以兼具高敏感性和高特异性。冠脉造影是目前评估冠脉病变程度的“金标准”,但该检查价格昂贵,风险性高,且具有辐射性。因此,临床上亟需安全有效的新型生物标志物,以应用于ACS的诊断和冠状动脉病变严重程度的评
猪血凝性脑脊髓炎是由猪血凝性脑脊髓炎病毒(Porcine hemagglutinating en cephalomyelitis virus,PHEV)引起猪的一种高度接触性传染病,已对多个国家的养猪业造成较大的经济损失,目前尚无特异性的抗病毒药物和治疗方法。前期研究发现,PHEV感染能引起神经细胞自噬,且该病毒复制增殖与自噬呈负相关;此外,PHEV感染能下调颗粒蛋白前体(Progranulin,
自动调制识别(Automatic Modulation Classification,AMC)是一种广泛应用于军事通信领域和民用通信领域的信号处理技术,采用预先设定的准则在给定的信号集中对带有不同干扰和噪声的通信信号的信号调制类型做出判断。目前关于通信信号识别的多数方法都是基于服从高斯分布的加性噪声进行调制方法识别。然而,近年来许多学者发现大部分的自然噪声和人为噪声以及两者的联合噪声常常以脉冲噪声
在当前电子信息战中,通信干扰手段复杂多样,若能快速、准确识别出不同干扰信号类型,便可采取相应的措施保证己方通信,对现代化电子信息战具有重要意义。传统的机器学习算法已被应用到典型通信干扰信号分类识别领域,随着机器学习理论和方法的不断发展,越来越多的学者对相应的改进算法开展了研究工作。本文的主要研究内容如下:1.研究了基于特征参数与改进支持向量机(Support Vector Machine,SVM)
近年来随着科学技术的快速发展,无人机的软硬件水平不断提高,在军用领域和民用领域都得到了广泛应用。在无人机的诸多应用中,目标追踪作为一项重要的子任务,在如城市反恐、地面打击和灾后搜救等应用中发挥着重要作用,也因此愈发受到研究人员的关注。而在实际应用中,单架无人机视野范围有限,任务环境复杂,易出现目标遮挡、丢失等干扰,因此如何在环境干扰情况下保持对地面移动目标的跟踪是一个具有挑战性的问题。为此,本文采
近年来,随着自动化、计算机、人工智能等高新技术的产生与发展,汽车逐渐与这些高新技术进一步紧密融合,通过这些融合促进了汽车智能化快速发展,同时智能车受到全球汽车行业及相关方面专家学者的研究,使得智能车在全球发展迅猛。轨迹跟踪控制是智能车研究的核心技术之一,其对智能车的实用化起到至关重要的作用。和传统前轮转向(Front-Wheel Steering,FWS)智能车相比,四轮转向(Four-Wheel
随着近年来自动化水平的不断提高以及计算机技术与信息技术的不断发展,越来越多的机器视觉手段被引入企业的生产流程当中,通过使用图像识别检测系统对工业组装产品各个器件进行检测,以识别各个器件是否安装正确。机器视觉取代人工作业,对提升检测系统的准确率、降低系统的复杂度与成本,提高劳动生产效率有着重要作用。本文针对汽车保险盒这一类工业组装产品的检测流程,设计了一套基于图像识别的质量检测方法,并进行了大量的实
随着工农业的蓬勃发展以及全球人口的爆炸式增加,人类用水量极大增加,全球约有10亿人生活在缺乏淡水资源的地区。地壳物质孔隙中长期储存的地下水占据着全球97%的淡水资源,是可作为生活用水的优质水体,地下水探测对人类社会尤为重要。核磁共振探测技术因其高效、定量及无损的特性,广泛应用于地下水资源勘探、隧道和高铁水文信息评估、地下水文信息调查及山体滑坡等水文灾害预警。在实际应用过程中,磁共振响应信号极其微弱
近年来,随着中国步入老龄化的时代,受中风疾病造成肢体残障的人群逐渐增多。中风严重危害到患者的身体和身心健康,并给家庭以及社会带来沉重的经济负担。因此,为中风患者提供有效的帮助是当今社会必须面对的重要问题。针对这一问题,本文以下肢康复机器人定为背景,分别从下肢运动意图识别、抗噪型归零神经网络的设计和稳定性分析、基于模型预测控制的被动式康复训练和主动式康复训练三个方面进行研究,解决康复机器人研究中存在
多输入多输出雷达(Multiple Input Multiple Output,MIMO)是一种新型的雷达体系,由于其具有分辨率高、稳定性好、抗干扰能力强和系统自由度高等优点,在信号处理领域得到了广泛的应用。其中,单基地MIMO雷达的波达角度(Direction of Arrival,DOA)估计作为空间谱估计的研究热点之一,得到了国内外学者的广泛关注。传统的DOA估计算法大多是基于高斯噪声的,但