【摘 要】
:
无人自主系统(Unmanned Autonomous Systems,UAS)是无人车、无人机等无人自主设备在现实场景中平稳运行的重要支撑系统,已广泛应用于社会的各种生产和生活场景,例如交通运输、应急救援、航空拍摄等。因此,实现无人自主系统面向无人车视觉场景和无人机视觉场景的感知与理解具有非常重要的理论意义和应用价值。为了实现无人自主系统对无人车视觉场景和无人机视觉场景的感知与理解,本文研究了无人
论文部分内容阅读
无人自主系统(Unmanned Autonomous Systems,UAS)是无人车、无人机等无人自主设备在现实场景中平稳运行的重要支撑系统,已广泛应用于社会的各种生产和生活场景,例如交通运输、应急救援、航空拍摄等。因此,实现无人自主系统面向无人车视觉场景和无人机视觉场景的感知与理解具有非常重要的理论意义和应用价值。为了实现无人自主系统对无人车视觉场景和无人机视觉场景的感知与理解,本文研究了无人自主系统的智能感知模块,并设计了一个对场景进行多维度感知理解的技术方案,即将场景理解与感知任务分为语义分割、目标检测和深度估计及目标距离测量等三个相关子任务,进而实现对场景的语义信息和目标的位置信息、深度信息以及距离信息等的获取,从而为无人自主系统提供可靠的场景信息。虽然国内外学者针对这三个子任务的研究取得了一系列成果,但仍然存在以下问题:1)现有基于无人车视觉场景的语义分割算法往往无法兼顾实时性和准确性;2)基于无人机视觉场景的语义分割任务的基准数据集较少,尤其是高分辨率的无人机视觉图像数据集;3)在目标检测方面,现有算法对视野受限区和边界区的检测效果较差;4)目前深度估计模型在边缘以及细节处精度较低,给距离测量带来巨大的挑战。通过深入分析与总结现有算法的不足和挑战,本文开展了以下四个方面的研究工作:(1)实现了无人车视觉场景的语义分割。本文提出了面向无人车视觉场景的轻量级语义分割模型,即基于非对称瓶颈模块的语义分割算法。为了追求更快的模型推理速度,该模型摒弃主流的编码器-解码器结构,采用只包含编码器的网络结构,并结合了空洞卷积、深度可分离卷积以及二分支结构等模块。通过在Cam Vid数据集和City Scapes数据集中实验,验证了本文提出的轻量级语义分割模型能够在保证准确率的情况下实时地完成语义分割。(2)实现了无人机视觉场景的语义分割。由于目前面向无人机视觉场景语义分割的数据集较少,所以本文依据类内差距大、类间差距小的原则制作了一个高分辨率的无人机视觉图像数据集。以该数据集为基准,本文提出了基于UNet的改进算法。改进算法的最大特点是将用于特征提取的卷积块替换成残差模块,加深网络结构,在防止梯度消失的同时可以使网络学习到更深层次的特征,有利于提高图像分割精度。(3)实现了无人车及无人机视觉场景的目标检测。针对目标检测中存在的错检、漏检情况,本文在YOLO v3算法的基础上进行改进,具体包括聚类最优的先验框、重构预测框过滤算法等。与原始算法相比较的话,改进算法不仅可以检测到简单环境中的目标物体,同时可以在复杂环境中实现目标检测,并且改进之后的算法对小目标物体更加敏感,比原始算法有更低的漏检率和误检率。(4)实现了无人车视觉场景的深度估计和目标距离测量。本文创新性地提出在深度估计的基础上进行目标距离测量。在无人车视觉的深度估计和目标距离测量研究中,首先提出了基于无监督学习的深度估计算法,通过深度估计网络输出深度图,然后结合无人车视觉场景中目标检测获得的检测框,使用聚类的方法选择最能代表目标物体的深度值,进而利用深度值与实际距离的关系进行距离测量。其中本文的深度估计网络使用双目图像进行无监督训练,无需输入图像的真实深度信息。综上所述,本文以计算机视觉技术研究为基础,探索了基于卷积神经网络的场景感知与理解算法在无人车视觉场景、无人机视觉场景上的应用和优化,为解决无人自主系统的多任务需求提供了新思路。
其他文献
移动通信在发展的过程中不断优化着用户体验,随着人民群众以及各行业日益增长的对更佳通信质量的需求,第五代移动通信(5G)已逐步推进建设。其中,毫米波频段的使用将缓解频谱资源短缺问题,实现高速率、低时延通信。毫米波天线作为无线通信中的重要一环,具有极高的研究价值。然而,毫米波损耗大、衰减快、传播距离近以及覆盖范围窄等问题限制了毫米波通信建设的推进。针对以上问题,本文围绕24GHz频段开展高增益毫米波多
近年来,随着移动通信技术和无人机(Unmanned Aerial Vehicle,UAV)产业的高速发展,无人机在无线通信领域中的应用成为研究热点。无人机可以作为空中基站(Aerial Base Station,ABS)或空中移动中继,在应急通信或临时通信场景中具有独特的优势。不同于传统的地面基站,无人机基站具有一些特殊的优势,如能快速灵活地按需部署,能提供良好的视距通信链路,能在3D空间自由移动
地海环境特性的研究对于遥感、雷达探测、目标识别等领域具备极大的科学研究价值,只有更加透彻地研究分析环境背景的特性,才能精准地捕获目标信息。通过实测获取环境的电磁散射特性数据代价高昂,因此亟需结合真实环境数据对环境背景进行精确建模,达到理论研究模型与试验测量数据相协同。随着深度学习技术迅猛发展,该技术为传统电磁学提供了一种新式的有效研究思路。本文主要基于真实地海环境数据对典型区域地海环境背景进行针对
针对冬季奥运会的钢架雪车比赛项目,通过运用达朗贝尔原理,本文阐述了钢架雪车运动员在比赛过弯阶段实现贴壁“飞行”的力学原理,设计制作了实验道具并开展了演示实验,阐明了适当的滑行速度和低重心是钢架雪车运动员安全顺利过弯的重要因素。本文还讨论了本演示实验在理论力学教学中的应用前景。
面对越来越复杂的多元化作战环境与国际态势,加之敌方干扰手段的多样化,如果只依靠单传感器来获取战场信息,那么必然会使其生存能力下降,使我方处于不利地位。因此,采用多传感器信息融合系统来洞悉战场环境已经成为一种必然的趋势。与单传感器相比,其增强了系统的可靠性与可信度,扩大了检测范围,减少了信息模糊度,使系统的生存能力大大提升,其优势显而易见。在多传感器系统中有许多功能模块,其中航迹与航迹的关联作为多目
随着“数据化”时代的到来,数据挖掘成为了研究的热点.研究者们从不同的角度出发,提出了很多有效的数据挖掘方法,取得卓越的研究成果,但同时也面临众多挑战,类不平衡问题就是其中的一种.为了解决该问题,已提出了很多基于算法层面的方法.这些方法主要是改进传统的机器学习算法,使其增加对少数类的关注度,或给予少数类更高的惩罚代价,以减少分类器对多数类的偏好,但是算法的分类性能提高不明显.集成学习作为一种增强单一
近年来,随着全球一体化进程的不断加快和多边贸易的成熟,中国航空货物运输业务的发展进入了新的增长时期。物联网技术的成熟,也在一定程度上扩大了传统航空货运的规模。空运业务和物流服务的发展,使得进口货物总量持续增长并且呈稳定上升趋势,同时进口货物类别也趋向于多样化。持续增长的进口货物数量和多样化的进口货物类别,对海关基地仓库存储能力和仓储管理系统造成了巨大压力。目前海关保税区仓库基地已进行扩建工作,以满
随着科技的发展和人们生活水平的提高,人们对自身健康状况越来越重视。由于社会医疗资源的紧缺,移动医疗悄然诞生,极大的改善了人们的生活。目前我国对移动医疗的研究还处于初期阶段,急需开发使用便捷、界面友好的移动医疗设备,以满足现代人民生活需求。基于上述背景以及国内外移动医疗设备需求现状,本文以用户体验与应用为目的,开发了一种便携式人体电磁特性测量系统,借助Windows平台,利用C#语言,结合模块化软件
近年来,我国大力开展空间站建设任务,载人航天工程步入到“空间站时代”,空间科学任务前期都要开发地面仿真验证系统进行真实任务前的过渡任务试验和仿真人员培训,目前航天员的培训以及舱室设备的展示主要是在实验室建立物理仿真系统,实际操作演示的一定优点,但其过多占用场地并且前期投入非常高。因此有必要研究开发具有多功能和良好交互性的虚拟仿真系统。本文将虚拟现实技术应用到空间站仿真与演示中,开发了一套可以进行空
在过去的几十年中,非线性光学一直是发展最快的科学领域之一。这种非线性会引起许多有趣的光学现象,例如二次谐波的产生、克尔效应和饱和吸收。人们普遍认为,非线性光学材料的发现将在基础科学研究及工业方面起到至关重要的作用。在具有饱和吸收性的材料中,光的吸收会增加光强度。在早期将染料用作可饱和吸收体并通过被动调Q或锁模产生高峰值功率和超短激光脉冲之后,半导体可饱和吸收体镜得到了发展,并成为该领域的主流材料。