【摘 要】
:
近年来,为无人机提供计算机视觉功能逐渐成为一个热门方向。无人机视觉目标跟踪在高空监控、搜救和极限运动的拍摄等方面应用十分广泛。无人机目标跟踪的优势在于其可以通过视觉算法的反馈对自身位置姿态等参数进行调整,实现软硬件结合,对目标进行更好的跟踪。因此适用于无人机场景下的目标跟踪技术十分具有研究意义。无人机场景下的单目标跟踪与一般场景下的单目标跟踪的主要区别为,在空中拍摄的环境下无人机跟踪时间普遍较长,
论文部分内容阅读
近年来,为无人机提供计算机视觉功能逐渐成为一个热门方向。无人机视觉目标跟踪在高空监控、搜救和极限运动的拍摄等方面应用十分广泛。无人机目标跟踪的优势在于其可以通过视觉算法的反馈对自身位置姿态等参数进行调整,实现软硬件结合,对目标进行更好的跟踪。因此适用于无人机场景下的目标跟踪技术十分具有研究意义。无人机场景下的单目标跟踪与一般场景下的单目标跟踪的主要区别为,在空中拍摄的环境下无人机跟踪时间普遍较长,而且拍摄高度较高,拍摄角度容易发生变化以及相机可能发生快速运动等难点更为突出。因此,针对这些问题,本文主要提出了一种适用于目标跟踪的通用有效的相机运动补偿算法,并设计了一个新的适用于无人机场景的单目标跟踪算法框架。本文提出的相机运动补偿算法旨在解决无人机跟踪过程中相机发生快速运动的问题。当无人机相机发生快速运动时,目标在当前图像中的位置可能跳出由跟踪算法划分的局部搜索区域,从而导致跟踪失败。因此,本文提出的相机运动补偿算法结合视频序列自适应阈值来判断相机是否发生快速运动,如果发生快速运动,利用两幅图像间匹配到的特征点对计算单应性矩阵,对边界框坐标进行变换来实现运动补偿。实验结果表明,该算法在无人机数据集UAV123对跟踪算法实现较大提升,在一般场景数据集OTB100对原有算法的性能基本无影响,证明了算法的有效性与通用性。针对无人机场景下的目标跟踪具有长时跟踪、角度多变和高空拍摄等问题,本文提出了一种新的基于分类和匹配融合的单目标跟踪算法框架。该框架主要包含两个子跟踪器,判别器,重检测模块以及Refine模块等部分。判别器主要对基于匹配的离线子跟踪器Siam RPN++算法与在线更新且对目标判别力强的Di MP算法进行融合,自动根据当前状态选择最佳结果,并自动利用正确结果对跟踪错误的子跟踪器进行更新,同时可以判断当前画面中目标是否消失。重检测模块主要采用扩大搜索区域的Siam RPN++进行目标重找回。Refine模块主要使跟踪器输出的边界框更加精细。消融实验表明,本文提出的算法框架中的各个模块对最终结果均有较大的作用。其中增加判别器模块与重检测模块,算法性能分别具有11.3%与3.1%的较大提升。本文提出的算法在无人机数据集UAV123与Vis Drone2019挑战测试集上都有较为优异的表现。
其他文献
区域分割任务旨在对场景中特定的区域进行识别,属于计算机视觉领域中的分支任务,在自动驾驶、地图元素检测及视频理解等方面被广泛应用。相比于传统方法,基于深度学习的区域分割方法准确率更高。但仅利用高阶语义特征进行区域分割的方法受限于目标区域的尺度,常出现分割结果不完整、精度低的情况。针对具体应用场景,利用先验知识对高阶语义特征进行增强和补充成为改善分割结果的重要途径。本文的第一部分针对遥感影像场景下道路
由于获取及存储信息的技术手段飞速发展,观测数据总是表现出高维度大尺寸的特性,大规模数据的分析和处理成为当今信息处理技术的核心和关键。相比于传统的基于矩阵的处理方法,张量(即多维数组)更加适合这种高维度数据的表示和分析,它不仅能够直观描述高阶数据之间的多线性结构,还具有模型精简、可唯一辨识性强等良好特性,因此近年来被广泛用于多维数据的表示和处理中。然而,传统的张量分解算法在处理大规模数据时会面临内存
手部三维模型重建的目标是在给定的图像中恢复整个手部的姿态及表面形状信息。由于该任务可以广泛应用于虚拟/增强现实、机器人抓取、智能家居等众多领域,因此在近年来逐渐成为了计算机视觉领域的研究热点之一。然而,考虑到人手自由度高、自遮挡和自相似严重的问题,许多方案依赖手部三维真值进行全/强监督训练并取得了很好的成果,但也由于三维标注很难获取而限制了方案的实用性。同时,现有的方法更关注网络在某个数据集上的性
自动视频分割任务近年来扮演着越来越重要的角色,该任务不仅被应用于视频会议、自动驾驶等针对特定类别目标的场景,还广泛被应用于包含世界万物的视频场景。然而,由于视频场景复杂且物体在时序上外观变化剧烈,多目标自动视频分割任务在实例分割精度和时间连续性方面仍面临着巨大的挑战。现阶段多目标自动视频分割的研究成果共有的问题包括:相似物体区分困难以及复杂场景物体丢失等等。针对这些问题,本文的研究工作基于时空域的
近年来,深度学习技术蓬勃发展,自动驾驶技术以及其他移动机器人技术也受其影响而取得了巨大的进步。在这些技术领域中,稠密而精确的深度信息,即距离信息,对于多种任务都有着重要的辅助作用。然而,使用To F传感器或激光雷达采集到的深度图均是稀疏的,因此深度补全任务受到了越来越多的关注。本文针对现有的深度补全算法的局限性开展了两方面的研究。Transformer网络结构在自然语言处理领域和计算机视觉领域均取
基于视频的车辆黑烟检测技术对环保工作具有十分重要的意义,在城市环保、智能交通等方面具有广阔的应用前景。现阶段将深度学习技术应用于车辆黑烟检测的研究,大多通过二维卷积神经网络实现对车辆黑烟图像的特征提取,仅依靠黑烟的空间特征使得模型检测能力有限,黑烟检测率低。考虑到实际应用中道路监控视频常常作为黑烟检测的信息流,本文提出了一种新的基于三维卷积神经网络和非局部注意力机制的黑烟车检测网络以充分利用车辆黑
在内能源自动机的动力学计算过程中,通常不考虑驱动与自动机工作循环之间的相互影响关系(即耦合关系),但这会对计算精度造成一定的影响,因此想要提高动力学计算的精度,更好的为内能源自动机的研究设计提供参考,就必须要考虑驱动与工作循环之间的耦合。本文为分析某新型内能源自动机驱动与工作循环动态耦合特性,以某纵动炮闩导气式自动机为研究对象,以该自动机组成及工作原理为基础,建立了工作循环图。采用经典内弹道理论对
为提高轻型高机动车辆的安全性和机动性,需要提高车身防弹性能、降低防护装甲质量,研究轻型复合装甲就至关重要。本文以新型Si3N4增韧陶瓷为研究对象,开展陶瓷复合装甲结构匹配设计及轻量化分析研究。首先对Si3N4陶瓷进行材料动静态压缩实验与飞片平板撞击实验,通过拟合获得Si3N4陶瓷的JH-2本构模型参数;然后对国内外陶瓷装甲的防护标准和测试标准进行总结,并以此为基础对Si3N4陶瓷进行DOP剩余侵深
现代社会下公共安全需求不断增长,监控视频,摄像设备在机场,火车站,地铁,商场等公共场所有着广泛的应用,这些摄像设备主要用来储存和记录监控区域发生的事情,来保证社会的公共安全,因此行人重识别作为计算机视觉的一项关键技术得到了迅速的发展。行人重识别主要解决跨摄像跨场景下行人的识别和检测,在跨摄像头条件下,光照差异,视角差异,物体遮挡,人体姿态差异等因素为行人重识任务带来了巨大的挑战性。随着深度学习技术
目的 总结评价认知障碍患者走失风险管理的最佳证据,为临床护理工作提供循证依据。方法 计算机检索BMJ Best Practice、UpToDate、英国国家临床示范研究所、国际指南协作网、苏格兰校际间指南网、加拿大安大略护理学会、美国国家指南交换中心、加拿大医学会临床实践指南信息库、新西兰临床实践指南、澳大利亚临床实践指南平台、德国医学科学协会、Cochrane Library、Embase、Pu