【摘 要】
:
旋翼型无人机因其成本低、易维护、可扩展性强的特点,受到了广泛的使用。目前在大部分应用场景下都需要人工对无人机进行操作,因此有必要让无人机具有自主执行一些任务的能力,以降低其使用门槛并节省人力。无人机在自主执行任务的过程中,很多导航过程与任务的执行可以依靠视觉来自主完成。因此本文围绕一种可自主进行目标搜索、返航与精准降落的四旋翼无人机,进行了以下主要工作:首先,本文完成了帮助无人机实现上述功能的视觉
论文部分内容阅读
旋翼型无人机因其成本低、易维护、可扩展性强的特点,受到了广泛的使用。目前在大部分应用场景下都需要人工对无人机进行操作,因此有必要让无人机具有自主执行一些任务的能力,以降低其使用门槛并节省人力。无人机在自主执行任务的过程中,很多导航过程与任务的执行可以依靠视觉来自主完成。因此本文围绕一种可自主进行目标搜索、返航与精准降落的四旋翼无人机,进行了以下主要工作:首先,本文完成了帮助无人机实现上述功能的视觉系统的设计。针对无人机所要执行的任务,将系统分为了地面端系统与无人机端系统两部分,设计了视觉系统的硬件结构与软件结构,并在此基础上给出了系统的工作流程。之后,对实现目标搜索功能的目标检测算法YOLOv3进行了学习策略的调整,并在无人机视角的数据集上进行了训练。通过实验对无人机视角下用YOLOv3进行目标检测的精度进行了分析,验证了方案的可行性,并将训练好的YOLOv3模型在视觉系统中进行了优化部署。然后,为了提高目标搜索功能可搜索目标种类的灵活性与可扩展性,本文研究了在YOLOv3模型上灵活增加可检测目标类别的增量学习的方法。通过实验对所设计的YOLOv3增量学习方法的效果进行了分析,验证了我们设计的方法可以在一定程度上实现YOLOv3灵活、快速的任务扩展。最后,设计了一种使用视觉基准标记组合的单目定位方法,使视觉系统能够在较大高度范围内对降落位置进行高精度的定位,帮助无人机实现了返航过程中的精准自主降落。通过实验对我们设计的视觉标记组合的定位方法的定位精度进行了分析,说明我们所提出的定位方法较以往方法可减少定位过程中的振荡。
其他文献
动态物体检测技术已经被广泛应用于生活中的各个领域。本文在研究动态物体检测技术发展现状及应用的前提下,针对传统动态物体检测存在的对噪声和光线变化敏感、物体往复运动存在“鬼影”误检测、无法检测深度信息等问题,提出了使用双目相机进行动态物体三维检测的方法,并搭建实验装置和实验场景,对关键技术进行分析与研究,编写算法实现的代码。提出了一种改进的自适应混合高斯背景建模算法,利用双目相机得到的深度图,进行三维
随着信贷业务的发展,对用户个人信用的评估也变得越来越重要。本论文设计的个人信用评估系统,目的是为企业处理信贷业务提供参考指标,降低企业风险。本文研究了国内外个人信用评估技术的发展现状,调研了企业对个人信用方面的需求,根据业务流程和用例图,对系统进行了功能性和非功能性需求分析。完成了系统的架构设计,对系统进行了概要设计和数据库设计。确立采用Spring框架,Neo4j图形数据库存储数据,Java和P
随着产品质量和生产效率的不断提高,制造业对生产加工过程中的检测技术提出了新的要求。大型船舶制造装配过程中,针对管路对接易出现偏差的问题,现有的检测技术通常采用由操作人员在被测工件表面进行人工检测并划线标记的方法,测量效率低,无法保证测量精度。本文研究了基于双目视觉的三维投影标示系统,利用双目相机对三维空间中特征点进行定位,再由投影设备将测量结果标示在被测物体表面,实现测量可视化,提高了装配检测过程
结构光显微(SIM)是一种宽场、高效的超分辨成像技术,具有低光毒性、成像速度快、无需特殊荧光标记的特点,在活细胞成像领域有着不可比拟的优势。而许多生命活动转瞬即逝,当前的成像速度会错过很多重要的细胞内部作用机理,提高时间分辨率对于细胞器之间、内部作用机理的观察有着重要作用,重建速率的改善也利于实现细胞实时成像。目前主流SIM系统在硬件性能和系统同步效率上已经充分优化,提升空间有限,而重构算法仍需大
SLAM(Simultaneous Localization and Mapping)解决的是机器设备在未知环境中如何感知环境的问题,Kinect相机因其可以直接获取深度信息,节省宝贵的计算资源,在视觉SLAM中应用广泛。本文主要从以下四方面对基于Kinect相机的视觉SLAM算法进行研究:首先,对Kinect相机的成像模型进行分析,完成Kinect相机的彩色摄像头与深度摄像头的标定实验,确保图像
量子图像传感器(Quanta Image Sensor,QIS)是一种具有空间过采样、时间过采样和单光子计数特点的新型图像传感器,它的提出是用来突破由于极小像素尺寸和较低电源电压所导致的CMOS图像传感器信噪比和动态范围降低等瓶颈。量子图像传感器具有极为广阔的应用前景,例如低光成像、高动态范围成像、高速摄像以及高分辨率成像等。目前,量子图像传感器的研究中依然有很多问题亟待解决,比如二进制数据的高速
近年来,眼动追踪技术逐步发展并被应用于多个领域。在学术和工业研究中,对眼动数据定量化比较的要求越来越高。相比注视点数目,注视时间,扫视幅度,眨眼次数,瞳孔尺寸等传统的眼动数据定量化指标,基于信息论中香农熵和条件熵生成的平稳熵和转移熵在度量眼动特征时表现出优势,并受到越来越多研究者关注。平稳熵反映了注视复杂度,转移熵反映了扫视复杂度,但是这两个指标仅能反映整个观察区域内注视点分布特征和视线转换特征,
气液固三相流化床在石油、化工、制药、环保等领域中应用广泛,准确地提取相含率、流速等流动参数,对于安全、高效生产具有重要意义。由于多相流流动特性复杂,现有检测方法实时性难以满足气液固三相流检测要求。电学层析成像具有非侵入、无辐射、响应速度快和可视化等优点,在气液固三相流参数检测中具有明显优势;融合两个或多个模态的电学成像方法有望解决气液固三相各相含率分布的在线检测问题。本文针对气液固三相流参数检测的
现如今,球形全景图已经成为场景记录和可视化显示的一种常用数据形式。全景球形图像呈现的是在空间的单个点捕获的360度场景,可以通过全向相机拍摄或通过拼接多张平面透视图像合成来产生。另一方面,面向平面透视图像的运动恢复结构(Structure-from-Motion)的技术越来越成熟,此技术是利用多张包含视觉运动信息的二维透视图像估计拍摄场景的三维结构。然而由于球形全景图的几何特性,现有运动恢复结构的
目前甲状腺癌症发病率逐年上涨,居于世界女性癌症发病第四位。早期发现甲状腺癌症如果进行手术治疗,患者的5年存活率高达96%。因此,早期发现和诊断是控制病症的关键。超声成像技术具有无创性、无辐射、低成本和实时成像等优点,是早期检测和诊断甲状腺癌最常用的成像方式。然而,使用超声精准的诊断甲状腺结节需要放射科医生具有大量的临床实践经验。目前,随着深度学习的快速发展,应用深度学习技术处理医学图像问题已成为一