面向不平衡数据的遮挡车辆检测方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:you0tmd1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能、视觉计算等重要技术的不断发展,自动驾驶逐渐成为提高车辆综合性能的发展大趋势。车辆检测具有监控道路交通情况、实时获取路面信息等功能,已经成为自动驾驶中至关重要的一部分。然而,实际交通道路的场景多样性、车载图像采集设备的角度多变性,使得车辆之间的相互遮挡成为必然现象,导致常规车辆目标与遮挡车辆目标之间表现出分类不平衡的特点,而传统检测算法在应用于遮挡场景的车辆检测时更易产生漏检、误检的问题。因此研究遮挡场景下的车辆检测模型,提升综合检测性能,在保证自动驾驶系统的安全运行的问题上具有实质性意义。本文以车载摄像头采集的车辆图像数据作为研究对象,建立面向不平衡数据的遮挡车辆检测模型。主要研究内容如下:(1)基于深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks,DCGAN)的不平衡数据图像增强方法研究。针对遮挡场景中车辆图像不足的问题,在数据层面研究了遮挡车辆图像的数据增强方法。首先,对数据集进行车辆图像预处理,利用DCGAN在图像生成方面的优势,对具有遮挡情况的车辆图像进行数据扩充;其次,使用多种传统图像增强方法提高数据样本数量,并对增强后的车辆图像进行质量评估;最后,将生成的图像与公开数据集中的部分车辆图像结合,共同构建成本文实验所用的数据集。(2)基于改进密集框选取策略的遮挡车辆检测方法研究。针对传统车辆检测方法中遮挡场景车辆目标的漏检与误检等问题,提出一种改进的冗余密集框处理方法。该方法由两部分组成,一部分是通过分析传统非极大值抑制(NonMaximum Suppression,NMS)在进行冗余框后处理时的实现细节,发现其在处理遮挡问题时的不足,并通过软化非极大值抑制(Soft Non-Maximum Suppression,Soft-NMS)进行优化;另一部分是将检测模型的损失函数改进成适用于遮挡场景目标检测的Repulsion损失函数。同时,为了减弱不平衡图像分类对检测模型造成的性能影响,利用图像增强后的遮挡车辆数据训练检测模型。通过实验结果对比表明,提出的方法相较于未经图像增强的传统检测方法,具有更高的检测精确率。(3)基于迁移学习与少样本检测器(Low Shot Transfer Detector,LSTD)的遮挡车辆检测方法研究。考虑到模型的训练过程中,遮挡场景下的图像分类具有突出的不平衡性,同时遮挡场景的图像增强在数据多样性方面存在限制,提出一种以迁移学习为理论基础,基于LSTD的遮挡目标检测方法。该方法融合了单发多框检测器(Single Shot Multi Box Detector,SSD)与Faster R-CNN在目标检测任务中的方法优势,结合背景抑制与知识迁移正则化方法,以无遮挡场景的车辆图像训练检测预模型并将其迁移到遮挡场景下,实现在数据分类不平衡情况下遮挡车辆检测模型的综合性能提升。实验结果表明,提出的方法在保证了遮挡场景下车辆目标检测精确率的同时,提高了检测模型的训练速度。
其他文献
工业机器人由于其高效且稳定的特点,被广泛应用于单一产品的组装环节。近年来随着机器视觉技术的发展,基于视觉引导的工业系统成为研究的热点。拆卸场景相比于装配环节更为复杂,面临产品内部组件的完整性与空间位置的不确定性的考验,需要工业机器人具有更强的智能性与自主感知环境的能力。目前已有不少研究成果将机器视觉运用在拆卸领域中,但大多数方法仍基于人工选取特征,需要依赖于专业的知识背景,且对生产环境的稳定性要求
学位
随着高性能计算技术的快速发展与智能设备的广泛普及,4K/8K高清视频、虚拟现实等新型应用服务正逐步走进人们的日常生活。然而,这些应用服务产生的计算任务通常具有计算密集或时延敏感特性,给通信与计算能力有限的用户设备带来了严峻的挑战。移动边缘计算(Mobile Edge Computing,MEC)是基于5G演进,将移动接入网与互联网业务深度融合的一种新的计算范式,旨在将云计算与云存储功能拉近到网络边
学位
目前,心血管疾病不仅是全世界各个国家的人群所面临的重大健康威胁,更是我国当下死亡病因中的首要因素,且其患病人数与死亡人数在近几年中依然继续保持增长。因此,进行有关识别心率失常及其对应类型的自动分类算法的相关研究有着很大的现实意义。目前,基于心电图信号的心率失常自动识别与分类算法主要依赖深度学习方法。但是,一方面,深度学习方法需要将ECG信号划分为用于训练和测试网络模型的单个ECG心拍样本,因此需要
学位
作为最常用的人体行为,手势以其复杂多变的含义和灵活便捷的操作方式,成为聋哑人与外界最重要的无障碍沟通途径。由于手语在日常生活中普及率不高,专业手语翻译人员严重不足,而手语机器翻译能有效缓解这一问题。手语机器翻译是为了将手语动作转换为更易理解的口语或文本等自然语言结构,在人机交互、智能家居、虚拟现实等领域有着重要的研究价值和宽广的应用前景。手势因其灵活多变、空间占比小等特性包含了较多的细粒度信息,同
学位
目前关于人体动作的研究主要关注于单一的动作识别或动作预测,无法同时识别并预测人类的动作。在人体动作识别方面,在三维骨架的特征提取上没有充分考虑骨架之间的时空关系,导致识别准确率受到限制。在人体动作预测方面,现有的研究没有考虑人体关节运动幅度的差异性,导致预测的结果不够稳定。协作机器人正在出现在各种复杂的制造环境中,使制造业朝着高效智能方向发展,人机协作的重要性不断提升。将人体动作识别与预测方法应用
学位
磁共振成像(Magnetic Resonance Imaging,MRI)是一种常用于临床和临床前应用的医学成像方法。在磁共振成像的长时间扫描中由于受试者运动导致图像中出现的运动伪影会影响医生和研究人员的判断。因此,如何快速有效的去除图像中的运动伪影是一个亟待解决的难题。近年来,基于生成对抗网络(Generative Adversarial Network,GAN)的深度学习算法在MRI运动校正领
学位
随着深度学习在计算机视觉领域的高速发展,出现了越来越多的具有代表性的目标检测算法,尽管当前算法在许多现实世界场景的目标检测中取得了显著进步,但在物体密集分布场景中的检测精度仍有待提高。现有的目标检测算法在对物体形状相似、位置非常接近的密集场景检测中,会出现检测框包含部分物体或者多个物体的情况,检测率较低,而在对物体相互重叠、强背景影响的密集场景检测中,甚至会出现漏检、误检的问题。鉴于此,本文面向现
学位
近些年来,伴随着虚拟现实(Virtual Reality,VR)技术不断发展,VR平台逐渐完善,VR产业已经进入了快速发展阶段。VR视频具有沉浸式的特点,能够为用户带来身临其境般的视觉体验,正在逐渐成为视频服务的新型载体。然而现有的无线网络依然不能满足VR视频传输过程中的高带宽、低时延的要求,无法进行高质量的视频传输。因此,如何根据人眼视场角的特点以及VR视频自适应传输过程中的传输特性,为用户提供
学位
煤炭在国民经济的各个领域中发挥着重要的作用,因此,煤矿能否安全生产,成为关乎国计民生的重要问题。在煤矿开采中,矿用提升机处于矿山运输环节的咽喉位置,通过使用钢丝绳牵引罐笼,负担着煤炭主井输运设备及人员任务。罐道作为罐笼的导轨,既可保证罐笼运行方向的正确,又可限制罐笼水平方向位移。由于煤矿地质条件较为复杂,煤矿的立井罐道容易受到外力的作用而产生形变,一旦立井罐道的整体线形发生变化或者局部发生形变,轻
学位
车用电子水泵是新能源汽车以及混动汽车内部冷却系统的核心部件,其性能优劣将直接影响汽车发动机冷却系统的冷却效果。车用电子水泵测试台能够完成对车用电子水泵的多项测试,有助于其生产厂家提高产品检测效率,缩短电子水泵的制造周期。针对当下车用电子水泵测试台存在试验项目单一、测量精度不够的问题,本文展开了对车用电子水泵相关测试技术的研究,设计并完成了车用电子水泵在线测试台的搭建。主要研究工作如下:分析车用电子
学位