【摘 要】
:
近年来,随着图像处理技术以及人工智能深度学习技术的发展,基于计算机视觉的目标检测在精度和速度上都达到了理想的性能。然而在自动驾驶相关领域中,仅依靠图像平面上的二维检测结果,无法有效获取目标在三维空间中的位置与结构信息。虽然依靠激光雷达等传感器设备可以获取空间信息,但相比之下单目相机更为经济便捷。因此,针对单目场景下的三维目标检测技术的研究有着重要的现实意义,同时具有广泛的应用前景。随着深度学习技术
论文部分内容阅读
近年来,随着图像处理技术以及人工智能深度学习技术的发展,基于计算机视觉的目标检测在精度和速度上都达到了理想的性能。然而在自动驾驶相关领域中,仅依靠图像平面上的二维检测结果,无法有效获取目标在三维空间中的位置与结构信息。虽然依靠激光雷达等传感器设备可以获取空间信息,但相比之下单目相机更为经济便捷。因此,针对单目场景下的三维目标检测技术的研究有着重要的现实意义,同时具有广泛的应用前景。随着深度学习技术在三维目标检测领域的广泛应用,涌现出大量优秀的算法,其中基于目标关键点的单目三维检测算法(Real-time Monocular 3D Detection from Object Keypoints for Autonomous Driving,RTM3D)表现优异。该算法在图像空间中预测目标三维边界框的9个投影关键点,然后利用二维和三维透视图间的几何关系恢复目标在三维空间中的尺寸、位置和方向。本文针对RTM3D在三维目标检测中存在的不足,进行算法的研究与改进,具体内容如下:(1)针对RTM3D算法对于目标9个投影关键点预估精度差的问题,提出了基于关键点级联回归的三维目标检测算法。设计精简高效的全卷积检测框架,实现对投影关键点的初始回归预测。提出一种基于可变形卷积的区域感知模块,对初始投影关键点局部区域进行特征提取,并利用区域特征对初始投影关键点进行自适应修正。通过对目标投影关键点的级联精准估计,显著的提升了单目场景下的三维目标检测精度。(2)针对图像中目标多尺度以及被遮挡的问题,提出基于循环十字交叉注意力机制(Recurrent Criss-Cross Attention,RCCA)的三维目标检测算法。设计基于RCCA的全局信息注意力聚合模块,解决传统卷积单元感受野固定以及无法提取全局信息的问题,实现针对目标自身情况的自适应特征区域关注,有效捕获全局场景特征对目标三维属性进行推断。在保证高计算效率的情况下,提升了对多尺度目标的三维检测精度,同时有效缓解了遮挡和截断带来的问题。将关键点级联回归模块与循环十字交叉注意力机制结合,提出可应对复杂场景的单目三维目标检测算法(Real-time Monocular 3D Detection based on RCCA and Keypoints Cascaded Regression,CR-RTM3D)。通过在KITTI数据集上的实验,验证了各个模块设计的有效性,同时证实了所提出的算法可以显著提升三维目标检测的精度。根据本文研究成果,设计了面向车前行驶环境的三维检测系统,通过对车辆和行人进行实时三维检测,实现对车前碰撞事件的预测。
其他文献
科技的进步带动着人类经济的发展和生活水平的提高,由于人类对提高物质生活水平的愿望更加强烈,日常生活中用到的各种设备向着自动化和智能化方向发展,这些进步都离不开高精度机械,因此如何提高机械设备的精度受到广大科技工作者的关注。非线性摩擦是影响机械伺服系统运动精度的关键因素之一,其几乎存在于所有的机械伺服系统中。非线性摩擦会使系统稳态误差增大,导致系统精度无法满足要求,因此如何解决系统中存在的摩擦已成为
随着勘探程度的逐渐提高,低幅度构造的勘探逐渐受到重视。塔北隆起西段中、新生界是库车陆相油气向南运移、聚集成藏的有利区,白垩系巴西改组在火山岩潜山构造背景下的低幅度构造已获突破,继而展示了塔北西部中新生界低幅度气藏具有良好的滚动勘探前景。本文针对该区深度域资料,首先通过地层切片研究,印证了下伏火山岩潜山低幅度构造背斜发育的基础,再通过地质条件的分析及高精度的构造图编制等技术措施,探讨了在解释阶段研究
古往今来,图像信息在人们生活工作的方方面面都发挥着至关重要的作用,但由于受各方因素的影响,图像质量并不能得到保证,这对图像恢复的工作提出了更高的要求,去噪和去模糊是图像恢复中主要的成像逆问题。在目前比较流行的深度神经网络方法中经常使用大量数据集来训练模型完成图像恢复工作,但是却无法应对缺少数据或无法获得原始数据的情况。此外,当训练中的观察模型与测试模型不匹配时,深度网络的方法表现不佳。针对以上问题
随着科学技术的不断发展,数字信号处理技术越来越成熟,电子医疗、智能家居、工业控制等领域对于相关技术有了越来越高的需求。模拟电路和数字电路之间的转换电路——ADC,是众多电子类产品中非常重要的电路模块。基于过采样技术与噪声整形技术的Sigma-Delta ADC,具有高精度、高信噪比和容易集成等优点,因此得到了广泛的应用。Sigma-Delta ADC由模拟部分的调制器电路和数字部分的抽取滤波器电路
近场通信(Near Field Communication,简称NFC)技术由非接触式射频识别(RFID)技术及互联互通技术整合演变而来,具有速度快、安全性好、抗干扰能力出色等特点。近年来NFC技术大量应用于包装盒技术,NFC技术的加入使得包装盒对用户更加友好,使得人机交互更加便捷,也促使智能包装逐渐应用于物联网领域。但目前实际应用中的NFC防伪措施存在易伪造、易转移等缺点,无法起到真正的防伪作用
随着量子通信在理论和实验方面的研究逐渐成熟,量子通信技术的实用化成为研究热点,其中,量子保密通信网络是一个重要方向。目前,专用量子通信网络已经在实际场景中成功搭建,但由于专用量子通信网络建设成本太高,并且需要经典网络的辅助,因此研究者们提出一种解决方案,即量子信息、经典信息和量子保密信息共纤传输,搭建经典通信与量子通信兼容的量子城域网。该网络中经典信息可以通过所有路由器进行转发,量子保密信息只能通
本文针对宽带阵列天线进行了研究,主要工作如下:1.结合工程项目需求,研究了具有波束扫描功能的宽带偶极子阵列天线。改进了马春德(marchand)巴伦,所设计的馈电结构实现了三阶阻抗匹配,有效展宽了偶极子天线的带宽。在HFSS软件中对天线进行全波仿真分析,同时给出其等效电路模型,利用HFSS和ADS联合仿真对天线进行带宽验证。所设计出的天线在电压驻波比(VSWR)小于2时,具有72.7%(工作频率范
新型超材料天线相比于传统相控阵天线有着系统简单、成本低、轻便、产生的随机辐射场稳定等多方面的优势,因此近几年超材料天线甚至有着逐步取代相控阵天线的趋势。虽然超材料天线可以代替相控阵天线以获得更高质量的导引头的前视成像,但是由于超材料天线必须使用载频变动的信号,这使得信号回波中出现了一个相位误差,导致适用于相控阵天线的基于压缩感知的超分辨关联成像算法,虽然其成像分辨率高、运算速度较快,但是却无法正常
随着无线通信技术的飞速发展,低频段的频带资源开发日渐饱和,人们迫切需要对毫米波以及更高频率的频谱资源进行开发和利用。间隙波导作为一种非接触式半封闭的新型波导结构,具有低损耗、易加工、可模块化的优势,在毫米波以上频段的天线阵列、大型馈电网络、滤波器、有源器件封装等工程设计中具有广阔的应用前景。毫米波多波束天线可以使用无源波束赋形网络实现毫米波天线的波束扫描,提高天线的增益,实现频谱资源利用率的最大化