无人驾驶场景下的行人检测

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:lqtanj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能科学的发展,无人驾驶汽车已经成为当今世界的研究热点之一。作为无人驾驶汽车系统环境感知模块的重要组成部分,行人检测也越来越受到人们的重视。本文研究无人驾驶场景下基于深度卷积神经网络的行人检测算法,针对多尺度检测、夜间检测和数据增广三个方面展开了相关研究,主要研究内容如下:1)提出了一种基于多尺度分类的行人检测算法。直观上,不同尺度行人的特征有明显的差异,单个分类器很难同时将不同尺度的行人与背景区分开来。因此,本文设计了一种多流分类回归器分别处理大尺度候选框和小尺度候选框的特征。另外,采用两个辅助监督平衡不同尺度候选框对反向传播的影响。在City Persons、Caltech和ETH数据集上的实验结果表明,该算法相比于基准方法检测性能有所提升,尤其是在小目标上提升显著。值得一提的是,该算法在提升性能的同时还降低了计算成本。2)提出了基于局部图像增强的夜间行人检测算法。现有的多数行人检测算法都面向白天场景,而在夜间数据集上泛化能力较差。在夜间场景中,不同光照区域的行人特征存在明显的差异。解决该问题的一种有效手段是通过对图像中的行人区域进行局部图像增强,提高行人外观特征的辨识度且减小不同行人之间的差异性。因此,本文分别从图像和特征的角度引入图像增强模块以辅助夜间行人检测。首先,本文提出了一种基于行人重分类网络的夜间行人检测算法。该算法根据初始检测网络的检测结果从图像中裁剪出对应的图像块,并使用局部图像增强处理图像块,而后使用分类模块重新估计图像块的置信度。其次,本文提出了一种基于特征变换的夜间行人检测算法。该算法根据标注的行人边界框对行人区域进行局部图像增强,并利用增强后的图像训练教师模型,而后用教师模型引导学生模型对原始夜间图像进行训练,使学生模型提取的行人特征逼近教师模型,具有更强的鲁棒性。在ECP数据集上的实验结果表明,本文提出的两种算法均优于基准方法。3)提出了一种基于分割掩码的行人数据增广方法。现有的行人检测数据集中有很多背景图像不包含有效的行人样本,若利用这些图像训练模型,则在训练过程会出现严重的正负样本不均衡问题。若在训练阶段过滤背景图像,则导致训练数据量减少、数据多样性降低。本文设计了一种数据增广方法,该方法根据标注的行人分割掩码裁剪出对应行人样本,并依据训练集中行人样本位置和高度的分布规律,将行人样本与背景图像重新组合生成新的图像。该方法可以增加训练数据量,并显著提高训练数据的多样性。在City Persons数据集上的实验结果验证了该方法的有效性。
其他文献
随着科技的发展,工业制造领域的智能化已越来越高,例如汽车制造和维修领域。其中,空间三维信息的提供起到了关键作用,本文将以此作为出发点进行三维重建技术应用方案的研究。在较为成熟的激光三角法技术的基础上,本课题将提出基于激光三角测距法的三维重建系统。通过对此系统的设计与研究来完成可以测量大体积物体的任务,提供可靠性高、较为准确的数据信息,同时减少环境光对三维重建效果的影响,最终完成对被测物体的轮廓扫描
本文针对铝合金构件自动焊接接缝跟踪存在的镜面反射、弧光干扰、飞溅等难题,开展铝合金焊接接缝自动跟踪系统设计、接缝坡口视觉图像质量影响因素分析及预处理、偏差提取与在线跟踪调控、跟踪系统集成及试验验证等4项技术研究,突破铝合金焊接弧光和镜面反射干扰消除技术、坡口图像特征点提取、铝合金焊接变形对跟踪精度的影响、偏差提取算法设计等4项关键难点,研制了激光接缝跟踪焊接系统,开发了激光接缝跟踪算法及调控软件,
随着光学成像技术和信息处理技术的不断发展,单一传感器对场景信息的重现已无法满足复杂场景下对光学目标的探测需求,技术人员开始结合多种类型的传感器,目前多传感器信息融合技术已被广泛应用在军事、安防、医学等多个领域中。多源图像融合是多传感器信息融合的典型应用之一,该技术通过互补性强的、不同成像类型的传感器来获取同一场景下的图像,并对这些图像进行融合处理。视觉显著性表示某些目标在某一特定场景中能够吸引观察
使用探测器阵列是一种直接测量远场激光光斑能量分布的方法,该方法使用探测器阵列靶板接收激光光斑,靶面按照一定的密度排布激光探测器,通过后续对探测器响应信号的处理可以得到光斑空间能量密度分布。探测器阵列采集到的光斑数据一般是离散且非均匀分布的,需要通过插值算法对其复原。本文根据激光光强高斯分布的特性,提出使用克里金法对光斑数据进行复原,从理论上分析了克里金法在光斑复原中的优势;根据靶板上探测器的排布方
捷联成像平台可以为图像末制导弹药节省大量空间与成本,提高系统的可靠性。但在载体的滚转运动过程中,与载体固连的成像设备也随之运动,使图像叠加了额外的旋转甚至产生模糊。图像电子消旋技术仅需使用相应算法对图像进行像素级处理,即可解决像旋与模糊问题,方便图像后续的观察与处理,在军事和民用领域均具有广泛的应用空间。本文结合图像末制导弹药的运动特点,指出捷联成像平台的图像像旋与旋转运动模糊等问题,对于在嵌入式
本文基于红外与可见光视频融合系统的资源需求,设计了基于FPGA的融合系统方案,完成了红外与可见光视频融合系统的硬件设计,主要包括多路视频采集电路模块、串口调试电路模块、视频存储模块、视频输出模块、电源模块以及FPGA正常工作所需要的外围配置部分。设计了融合系统电路原理图,并完成了PCB绘制、焊接和调试等工作,完成了融合系统的硬件平台的搭建。针对图像融合算法,本文结合在硬件平台上实现的实际要求,将拉
随着经济的发展和城市化步伐的加快,桥梁在交通运输中的重要性不断提升。总体来看,桥梁使用的安装状况整体较好,但是桥梁发生安全事故还是屡见不鲜,给国家和人民造成了不可估量的经济财产损失。为保证桥梁的安全,在桥梁的建造和使用过程中对其进行监测是一个重要的环节,而挠度测量是桥梁安全监测的重要组成部分,是评价桥梁安全与否的重要指标。基于上述问题,本文旨在研究一种基于深度学习和图像处理的桥梁安全监测系统,一方
航运在全球贸易中占有举足轻重的位置。冬季航行过程中船舶跟随破冰船开辟的航道航行以减少被冰困住的风险,但是此过程会增加船舶相互碰撞的风险,所以破冰船护航的跟驰模型研究十分必要。如今,船联网在逐渐的应用到船运当中,船联网在船队跟驰行为中具有普遍性和重要作用。在船舶航行过程中,船舶通信方面也是研究的重点,航海通信如今也是很多人关注的对象,航海通信对于提升船舶航行的效率与安全起到重要作用。在航运中的一些高
在航空领域,飞机驾驶舱内的机载显示系统在处理完各种传感器和雷达等信息后,将关键的描述飞行状态信息和导引信息的符号投射到飞行员正前方的显示画面上,直观地为飞行员提供帮助信息。精准的符号信息可以保证飞行员能时刻对飞机有正确的认识和把控,所以验证画面显示正确与否对保障飞行安全十分重要。但是,传统的验证方式采用的是使用目视观察和经验判断的人工测试,存在精确度低、人力成本高等问题。因此迫切需要研究机载画面符
近些年来,以文本、图像、音频、视频为主流载体的多媒体数据因社交软件和移动设备的广泛应用呈暴发式增长。正因如此,如何快速高效地在这样庞大的图像数据库中搜索符合用户需求的图片成为了图像检索的一个新的挑战。得益于哈希编码在计算能力和存储效率上的显著表现以及深度神经网络在图像特征表示上的强大学习能力,基于深度神经网络的深度哈希算法在近几年取得了空前未有的成功。从本质上讲,深度哈希算法通过一个训练成熟的神经