基于多路复用图像的目标检测与距离估计

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:jiandancaozuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉中一项基础关键的任务,在各种商业和军事领域都有着广泛的应用,具有重要的意义。一些应用场景,例如自动驾驶,不仅需要检测出目标在图像中的位置,还需要估计出目标的距离,因此如何高效地检测出目标的位置并且估计出目标的距离成为了一个极具挑战性的问题。多路复用成像设备使用一个感光元件接收并编码多个镜头视角下的画面信息,减少了数据通信和存储的开销。多路复用成像设备往往配有图像重建算法,用来恢复多个视角下的图像,从而生成宽视角图像或者立体图像。本文发现多路复用图像不仅含有物体在各视角下的视觉特征,可以进行目标检测,而且各物体在多个视角下的视差也被隐式地编码在图像中,为目标的深度/距离估计提供了可能。在此发现上,本文深入研究了基于锚框的深度卷积网络目标检测器,提出了基于多路复用图像的目标检测算法。本文提出的目标检测算法不仅可以在多路复用图像上检测出目标,而且能同时估计出目标的深度/距离。本文的主要贡献包括以下三点:(1)提出了基于多路复用图像的“anchor pair”策略。多路复用图像上的每个目标拥有来自于不同视角的两个边界框,而现有的锚框策略对于每个目标只能预测出一个边界框,为了解决这个问题,本文提出了基于多路复用图像的“anchor pair”策略,能够预测出目标的两个边界框。(2)提出了一种基于多路复用图像的一阶段目标检测算法Disparity SSD。本文将提出的“anchor pair”策略与现有的一阶段目标检测器结合,使其能够预测出多路复用图像上目标的两个边界框,从而推断出目标的深度距离。实验结果表明,和基于普通图像的目标检测器相比,本文提出的基于多路复用图像的目标检测算法Disparity SSD拥有相似的检测精度和检测速度,并且还能估计出目标的深度/距离。(3)提出了一种基于多路复用图像的两阶段目标检测算法Disparity RCNN。本文将提出的“anchor pair”策略与现有的两阶段检测器结合,验证了本文提出的策略适用于两阶段检测器。实验结果表明,本文提出的Disparity RCNN检测器能够很好的预测出多路复用图像上的目标,并且其对目标的深度估计性能优于现有深度估计算法与目标检测算法融合的方案。
其他文献
目前,神经网络和深度学习的理论与方法广泛应用于计算机视觉和目标检测的研究,其研究成果已广泛用于自动驾驶、航空出行、安防等领域。传统的目标检测方法依靠绘制在目标上的矩形,通过水平和垂直边界框来确定目标位置。航空图像中的物体方向随机,密集且周围复杂,因此对传统的物体检测模型构成了挑战。传统的矩形框会忽略物体的方向,从而导致物体定位减少,并且在目标密集情况下重叠的框会限制进一步的处理,例如目标的理解和检
随着仿真系统愈发复杂,以及用户对仿真应用的要求日益提高,仿真系统可信度评估正面临越来越多的挑战。可信度评估是指分析、计算和评价仿真系统可信度程度,并最终判断其是否可信的一系列复杂过程。如何正确地开展仿真可信度评估是当前研究的热点与难点,也是本文研究的重点。国外在可信度评估中引入可接受性标准(Acceptability Criteria,AC)的概念,通过从仿真需求或预期用途中归纳出合适的可接受性标
近年来新零售概念十分火热,多方行业巨头针对这一革新在国内展开布局,但当下中国的无人零售市场还处于初期发展阶段,没有达到规模化、秩序化,其中无人超市作为新零售的尖端产品始终没有一套统一而完善的解决方案,反而无人售货机相对来说可以更容易实现无人超市的部分功能和体验,仍然拥有很高的提升空间,但是现阶段市场反馈差强人意,存在很多问题,开发一款新型的拥有更高兼容性、更大发展空间、更智能人性的无人售货机势在必
随着社会经济和科学技术的快速发展,以老年智能手环为代表的智能产品为智慧养老提供了解决思路。然而,目前针对老年智能手环的研究和发展主要集中在功能创新和技术实现层面,缺少对人机交互方式的研究,现有产品复杂的功能信息和不友好的交互方式导致老年用户产生抵触心理。本文从用户行为逻辑的角度出发,将认知经验、行为习惯等内容与老年智能手环交互设计要素相结合,以降低老年用户的学习、认知和操作成本。首先,梳理行为逻辑
同时定位与地图构建(Simultaneous localization and mapping,SLAM)是一种同时获取未知环境三维结构和环境中传感器运动的技术。语义SLAM将语义信息包含到SLAM流程中,通过提供高层语义信息来增强SLAM系统的性能。将深度学习等人工智能方法与SLAM结合在一起,可以同时实现场景几何地图构建和语义信息提取的计算,这对于智能机器人定位与规划具有重要意义。本课题对基于
单兵虚拟作战平台是通过数据调整与虚拟仿真模拟复杂战场环境的综合作战平台,基于此平台的应用方式与虚拟技术优化自动步枪试验定型过程中的人机工效评价流程是本文所研究的重要方向,以此方向进行设计实践与设计评估。本文通过数据调研与实验方式开展基于单兵虚拟作战平台的自动步枪人机工效评价研究与设计实践,具体工作内容如下:分析自动步枪人机工效评价方法,确定了基于单兵虚拟系统的子系统的建立条件。通过研究,建立人枪肌
目标跟踪是计算机视觉中的重要研究方向之一,广泛应用于智能监控、人机交互、制导控制等领域。经过几十年的发展,研究人员提出了许多经典、优秀的跟踪算法,但由于实际环境的复杂性与目标的多变性,如光照变化、形变、遮挡等,目标跟踪仍然是一个非常具有挑战性的任务。近年来,精度与速度兼具的相关滤波跟踪算法吸引了研究者的广泛关注,而判别式尺度空间目标跟踪算法DSST是相关滤波算法中的代表算法之一,该算法基于MOSS
视频序列中的目标跟踪是一项基础且重要的计算机视觉任务。无论是在学术研究还是工业应用中,目标跟踪都有着深刻的研究意义与广泛的应用前景。本文基于多目标跟踪框架,探讨在密集场景下的目标跟踪。针对目标漏检、数据关联以及目标更新这三个方面,展开了深入的研究,主要研究内容与成果如下:(1)融合基于通道与空间置信度的相关滤波器跟踪结果在线跟踪多目标。本文研究发现在基于检测结果的多目标跟踪算法中,若目标被遮挡、或
同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术用于解决机器人在未知环境中的定位和建图问题,是实现机器人自主定位的关键技术,对机器人踏入实际应用领域具有重要意义。近年来,视觉SLAM技术依靠相机的成本低、获取信息量丰富等优势,成为研究热点。数据关联是SLAM系统的核心技术,旨在寻找观测信息与环境地图的对应关系,稳定准确的数据关联是SLA
细粒度图像识别近几年来在计算机视觉领域受到了广泛的关注,其任务是识别在外观信息以及语义信息都非常相似的物体子类,例如识别不同种类的“鸟”:如“棕头鸦雀”、“百耳画眉”,“赤腹山雀”等(或者识别不同种类的车:如“丰田”、“本田”、“路虎”等),具有广泛的应用前景。与传统的图像分类相比,细粒度图像识别的不同和难点在于:一是类间差异非常细微(比如鸟的不同子类或车的不同子类),不同子类对象间的差异主要体现