【摘 要】
:
深度恢复是计算机视觉领域的一个经典问题。近年来,基于深度神经网络的单视图深度恢复受到了学术界广泛关注。然而基于深度神经网络的单视图深度恢复往往只能生成模糊的估计
论文部分内容阅读
深度恢复是计算机视觉领域的一个经典问题。近年来,基于深度神经网络的单视图深度恢复受到了学术界广泛关注。然而基于深度神经网络的单视图深度恢复往往只能生成模糊的估计结果,由于其固有的不适定性,无法恢复出准确一致的场景尺度。为了解决这一问题,本文提出一种基于深度神经网络和多模态输入的深度估计模型,通过结合传统方法(立体匹配、硬件传感器等)得到的可靠深度区域,恢复得到更为准确且稠密的深度估计结果。该模型以RGB图像和稀疏但较为可靠的深度采样为输入,通过对抗学习的方法,提取来自输入的有效信息,并对场景深度进行建模,实现传统方法和基于深度神经网络单目预测方法的优劣互补,达到较好的深度恢复结果。具体来说,提出的深度恢复模型分为两个主要部分:初始深度估计部分和深度求精部分,以由粗到精的方式实现场景深度估计。深度求精部分创新性地采用了尺度残差学习方法,大大提升了系统的性能。另外,为了排除训练数据中深度采集噪声对系统训练造成的影响,本文提出了一种稀疏判别网络,使得网络的训练过程更加稳定,预测结果更加可靠。大量的实验结果证明,相比现有的其他基于深度神经网络的单视图深度预测方法,本文提出的方法无论在泛化能力还是预测准确性上都取得了显著提升。例如,就RMSE(均方根误差)一项而言,本文方法的深度估计误差在NYU-Depth-V2数据集[1]上降低了 0.39米,在KITTI深度预测数据集[2]上降低了 0.85米。除此之外,本文成功将本方法应用于场景深度恢复、雷达(LiDAR)数据补全和三维场景重建等应用场景,进一步验证了模型的实用性和可靠性。
其他文献
随着各类智能移动终端数量急剧增长,以及物联网的快速发展,移动通信系统的用户数量和数据流量呈现指数增长。面向未来移动通信各类应用场景需求,学术界和工业界对大规模MIMO(
身体作为人存在于世的基本载体,是我们感知世界的最初视角,也是我们的个体生命与宇宙万物相连接的重要媒介。在西方思想界开始了从意识哲学向身体哲学的转向以来,当代人文科学界和社会科学界都掀起了“身体转向”的高潮,“身体”成为后现代思想关注的焦点之一,聚焦了中西方学者共同的目光。然而,在当下的消费社会语境中,对身体美的过分关注和追求又使得身体面临着异化的现状。因此,对身体问题的思考极为重要,解析身体之美的
软件产品线工程作为实现软件复用的重要方法,近年来受到越来越多研究者的关注。随着软件规模和复杂度不断提升,领域可变性在不断增加,导致领域特征模型变得越来越复杂。因此,
现代信息技术的不断提高推动了无线传感器网络快速发展,在广泛的领域发挥了重要的作用。无线传感器网络是通过随机部署在监测区域的微型传感器不断地获取采集数据,处理并传送
随着半导体技术的持续高速发展,众核芯片内部可集成上百个处理器内核。多核或众核芯片在提供硬件资源更多并行性的同时,也使其任务调度和资源管理成为充分发挥和提升计算效能
教师的教学不仅影响着学生的个人发展,还影响着所在学校的发展。对于高等专科学校而言也不例外,高等专科学校教师的自身发展与学校的教学质量和学校的发展息息相关。但是众所
激光通信因其速率高、通信容量大、抗干扰能力强,保密性能好,带宽非常宽等优点,在各个领域得到了广泛应用。由于大气信道中大气吸收和散射及大气湍流运动等的影响,会导致链路
传感器作为物联网感知层的“五官”,由其组建而成的无线传感器网络(Wireless Sensor Networks,WSNs)作为物联网的“神经末梢”逐渐成为信息领域研究的热点之一。然而,传感器
随着信息技术的发展,应用软件在企事业单位得到了广泛使用。而传统的公园事项管理中,事务安排、文件管理、通知发布等工作完全依靠人工处理,由于单位内部部门不在同一地点办
为应对未来移动通信系统多样化差异化业务需求发展趋势,满足超高速率、超低时延、高速移动、高能效和大连接等技术要求,5G新空口(NR,New Radio)技术将基于更加灵活的帧结构、