自主空中加油的目标视觉检测与跟踪策略研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:tianzhihen1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器视觉和图像处理技术的不断发展,视觉目标检测、跟踪及测量技术得到了广泛应用。在航空航天领域中空中目标的视觉检测、跟踪及测量日益受到重视,特别是在空中复杂条件下,如何实现目标的检测、跟踪及位姿测量成为一个重要的课题。基于视觉的自主空中加油技术能够有效地减少飞行员在空中加油过程中的操作难度进而减少飞行训练成本,同时也能够有效地提高无人机装备的搭载水平和续航能力。基于视觉的鲁棒自主导航系统需要准确快速的目标检测与跟踪算法来保证控制系统输入信息的准确性与时效性。本文针对复杂条件下软管式空中加油的目标视觉检测与跟踪策略开展研究。主要的工作和贡献有:  (1)提出了一种基于目标形状特征的视觉检测与跟踪方法。软管式空中加油的锥套目标主要由三部分组成:内部黑心,伞骨和伞套。其中黑心部分的成像对光线变化不敏感,具有显著的轮廓特征。本文基于锥套黑心部分的形状先验知识制定图像处理规则,提出了基于目标形状特征的视觉检测算法,实现了对目标轮廓的有效检测;提出了基于目标形状特征的粒子滤波跟踪算法,实现了对目标轮廓的有效跟踪。提出了视觉检测与跟踪的切换策略,在无遮挡条件下,实现了对目标轮廓有效的检测和跟踪。  (2)提出了基于离线有监督学习的鲁棒锥套目标视觉检测方法。在空中加油过程中,会存在光照变化导致的目标图像亮度不均匀或局部饱和,空中气流扰动导致的锥套姿态变化,相对运动导致的目标尺度的变化及受油杆对目标的部分或全部遮挡等复杂条件。本文提出了两种基于离线有监督学习的锥套目标视觉检测算法,实现复杂条件下对锥套目标的有效检测。一种采用基于特定图像特征的支持向量机,利用低维归一化鲁棒局部二值特征,在不损失检测精度的基础上有效地减少了目标检测的时间。另一种通过深度卷积神经网络直接预测目标的类别和目标在图像的位置信息,通过图形处理器加速实现了对锥套目标的快速鲁棒视觉检测。  (3)提出了一种在线基于状态的并融合增量主成分分析的结构输出支持向量机目标跟踪算法。因光线变化、部分遮挡、自身尺度及姿态变化等因素的影响,目标的表面模型会不断的发生变化,进而导致跟踪失败等问题。本文通过融合生成模型和判别模型来设计鲁棒跟踪器,其中生成模型采用在线增量主成分分析实现对目标表面模型的不断更新,判别模型采用在线结构输出支持向量机实现对目标与背景的判别区分。将目标在图像空间中进行状态化表示,在目标跟踪的过程中直接预测目标在图像空间的状态。利用目标的虚拟状态,实现了判别模型和生成模型的效融合。  (4)提出了一种鲁棒检测—学习—跟踪框架,实现了检测器和跟踪器的有效融合。检测器的优势是全局判断目标的存在与否,进而实现目标的定位。检测器的劣势是需要离线学习,检测速度相对较慢。跟踪器的优势在于拥有局部的搜索域,拥有集中少量的训练样本,可以实现快速的在线学习,速度相对较快。在严重遮挡,光线剧烈变化等复杂条件下,目标跟踪器会逐渐产生漂移现象进而导致跟踪失败。本文通过检测器对跟踪器中判别模型的正支持向量进行置信度评价,寻找出不可靠的正支持向量。通过在线数据挖掘算法从观测的历史数据中挖掘出可靠的正支持向量替换不可靠的正支持向量,实现检测器对跟踪器的在线修正,从而减少跟踪器的漂移现象。通过检测器对当前跟踪的目标进行置信度评价,判断跟踪器是否产生严重漂移,进而决定是否进行全局检测。  (5)搭建了空中加油地面模拟平台。提出了基于单目视觉的空中加油目标的简化视觉测量模型,并给出了相机标定方法。将本文提出的视觉检测、跟踪及测量方法在地面模拟平台上进行了验证,利用基于位置的视觉控制实现了在笛卡尔空间对锥套的跟踪,模拟了空中加油的自主对接过程。
其他文献
ITS(智能交通系统)是解决交通拥堵、交通安全和交通污染等城市交通问题的一种有效方法,能够提高交通运行效率、降低交通事故发生频率。交通视频监控系统作为ITS的重要组成部分,能
遗传算法是模仿自然选择与进化的随机搜索方法。由于其隐含并行性和全局搜索特性,使其具有其他常规优化算法无法拥有的优点。然而,标准遗传算法存在着收敛速度慢、易“早熟”
本文以红外目标模拟器中的分离镜系统为研究对象,将变结构控制算法应用在这一系统中,并在此基础上和传统的控制方法对比,分析滑模变结构控制的优劣。首先,本文阐述了变结构控
随着互联网、智能手机和通信技术的迅速发展,互联网(包括移动互联网)上多媒体数据快速增长。文字作为一种普遍使用的交流工具,经常被人工添加到图像中以传递信息,并在网络(例如:微
针对BTT导弹控制系统的特性,本论文基于线性系统理论中的特征结构配置和模型跟踪方法,提出了鲁棒控制方法和可抑制抖动的多模型切换控制方法。 本文针对某型号BTT导
视频压缩编码是多媒体应用的关键技术。视频编码预处理,是指对视频原始数据进行处理,使之满足实际的视频编码的输入要求。视频编码预处理技术,是视频压缩编码的重要技术之一
锌钡白干燥煅烧过程是锌钡白生产最为关键一道工序,原锌钡白干燥煅烧转窑的控制由经验丰富的操作工人手动调节,这种调节方式取决于工人的经验和责任心,且调节存在比较大的滞后,造
从单张二维人脸照片中重建精确的三维人脸是计算机视觉领域里的一个重要并且具有挑战性的目标,其在人脸识别、年龄估计、人脸表情识别以及情感估计等领域具有重要的作用。三维
如何让机器人实现高精度、高柔顺性的操作,是机器人研究领域长期关注的问题。在机器人学与控制科学、机构学、材料学和计算机科学等交叉领域,已从不同角度对这一问题进行了研究
行人再辨识是多摄像机视频监控中的一个重要任务,其目标在于将多路摄像机在不同时间和地点捕捉到的行人进行自动关联,为行人目标的行为和活动推理分析提供基础。在视频监控中,不