【摘 要】
:
计算机三维视觉问题是计算机视觉领域的基本问题。其旨在使用2D图像恢复出原始场景3D信息,通过相机图像信息实现相机位姿获取、场景深度估计、排列生成三维场景等一系列任务。位姿估计、稠密深度估计以及计算机算力在近年来的飞速发展使得稠密三维重建工作并不再局限于传统的离线情况。因此,本文做出尝试,将视觉-贯导实时定位与建图(Visual-Inertial Simultaneous localization
论文部分内容阅读
计算机三维视觉问题是计算机视觉领域的基本问题。其旨在使用2D图像恢复出原始场景3D信息,通过相机图像信息实现相机位姿获取、场景深度估计、排列生成三维场景等一系列任务。位姿估计、稠密深度估计以及计算机算力在近年来的飞速发展使得稠密三维重建工作并不再局限于传统的离线情况。因此,本文做出尝试,将视觉-贯导实时定位与建图(Visual-Inertial Simultaneous localization and mapping,VI-SLAM)与基于深度神经网络(Deep Neural Network,DNN)的多视图几何稠密深度估计方法相结合,为稠密三维重建提供位姿与稠密深度信息,期望实现基于VI-SLAM的实时或半实时的场景稠密三维重建方案。本文主要工作归纳如下:第一,以视频流和IMU数据作为输入,使用VI-SLAM估计相机的运动位姿。在解算得到的相机位姿以及VI-SLAM筛选出的关键帧基础上,本文提出了用于多视图深度估计的关联帧筛选算法,为后续深度估计流程筛选出有效、鲁棒的关联多视图组合。第二,本文为解决部分基于DNN多视图稠密深度估计方案的缺点,对深度神经网络结构与损失函数进行了优化。结构上相比于现行方案采用了级联与图像金字塔结合的优化方案,损失函数上加入了优化的重投影损失函数作为正则项。由于重投影损失函数的加入也使本文中所采用网络能够进行自监督训练。对比结果,本文采用方案在已有基于多视图几何的稠密深度估计案中达到了精度与资源平衡的最优,且在已知的相应自监督方案中达到了最优的精度与资源占用结果。第三,在已知位姿变换与稠密深度结果的条件下,本文采用了TSDF方案进行稠密的场景重建。针对传统TSDF方案并不能完全适配VI-SLAM迭代式的位姿更新过程的问题,本文采用了一种位姿稳定判定机制并结合TSDF去聚合的方案,使TSDF方案增量式的更新VI-SLAM提供的较为准确、稳定的位姿结果。
其他文献
随着万物互联时代的来临,大量联网的嵌入式设备的安全性对信息安全至关重要。为了安全性考虑,一般在嵌入式设备上部署加密算法进行保密通信和身份验证,但大部分嵌入式设备的计算资源通常受到限制。目前已经被国际互联网工程任务组标准化的后量子密码算法之一的XMSS(e Xtended Merkle Signature Scheme)数字签名算法需要执行数万次HASH计算以生成密钥对、签名和验证,并且需要足够的内
机器人抓取是机器人领域的重要研究内容之一,在生产生活中有广泛的应用。在基于视觉引导的机器人抓取系统中,快速准确的物体位姿估计算法对提高机器人抓取效率十分重要。近年来许多物体位姿估计算法被提出,但它们在复杂场景中存在鲁棒性不足、难以处理物体的弱纹理和对称性等问题。针对现有位姿估计算法的问题,本文面向机器人抓取任务展开了物体位姿估计算法的研究,主要研究内容和成果如下:1)针对弱纹理物体位姿估计存在目标
TC4钛合金具有比强度高、抗疲劳特性高、耐腐蚀性好等优异性能,被广泛的应用于医学、航空航天等领域,选区激光熔化(SLM)技术具有快速性、低成本、精度高等一系列优点,可以充分发挥出TC4钛合金的优势。激光扫描速度会对SLM成形TC4合金的缺陷、组织和性能产生较大影响,但目前对激光扫描速度与微观机理演变规律的研究还不够深入,尤其是缺陷的表征和α’马氏体相的形貌特征及取向关系还有待进一步探索。因此,本文
为满足电动汽车这一高电压变比、大功率应用场合中的电压变换、电能双向传输、电气隔离等需求,隔离型双向DC-DC变换器的研究得到了广泛的关注。目前,有两个制约其进一步发展的技术难点,即充电效率较低和电池寿命较短,而变换器的电流应力决定了开关器件导通和关断过程中损耗的大小,是影响充电效率的重要因素,同时,电流的冲击也会缩短电池的寿命。因此,降低电流应力和功率损耗,提高容量和效率,是当下隔离型双向DC-D
小管道气液两相流广泛应用于能源、化工和医疗等领域,由于小管道气液两相流的复杂性,小管道气液两相流气泡轮廓重建技术在工业生产和学术研究中都有十分重要的价值和意义。为了更好地满足小管道气泡可视化、气泡轮廓机理研究和其他参数检测等方面的需求,本文基于小管道气液两相流的光学机理,对小管道气泡轮廓重建技术进行了研究,提出了一种小管道气泡轮廓重建新方法,该方法能够实现气泡截面轮廓和三维轮廓的重建。本文的主要工
癫痫发作是由脑神经元群异常放电所致。发作期间由于病人身体不受控制,当无人照看时极易受到损伤,这种反复的折磨严重影响着患者和其家人的生活。癫痫发作预测研究旨在病人发作前给出预警,以最大限度降低危害,具有很重要的应用价值。目前,癫痫预测研究已经取得了很大进展,但远没有达到实际临床应用的需求。从多个特征维度和视角研究大脑由正常到发作的渐变过程中的信息,对研究癫痫预测具有重要意义。本文一方面从注意力机制的
气液两相流是一种常见的流体形态,广泛存在于石油石化、金属冶炼、生物制药等众多轻、重工业领域的生产过程中,针对气液两相流进行检测具有重要意义。电导检测技术是一种经典和常用的气液两相流检测技术,一直备受科研人员的关注和重视。然而,传统的电导检测技术大多为接触式检测,存在电化学腐蚀、电极极化、电极沾污等问题,其应用受到诸多限制。电容耦合式非接触电导检测(Capacitance Coupled Conta
当前河道水面漂浮物清理手段主要以人工打捞为主,耗时耗力,安全性低,内河水面无人船具有环境适应能力强和人工成本低等优点,在水面漂浮物清理以及河道资源探索等方向有着广阔的应用前景,而视觉感知技术是无人船在自动行驶过程中获取周围环境信息的重要渠道。针对无人船视角的水上环境包含大量倒影干扰以及水中漂浮物面积比较小的问题,本文提出了联合水域分割任务和漂浮物检测任务的卷积神经网络模型;为了提高模型的推理速度,
水是人类生存不可或缺的资源,正确、有效地管理和利用水资源对经济发展有着重要的作用。在掌握水情、调配水量以及灾害防范中,河道流速和流量是十分重要的数据。传统测速方法使用旋桨式测速仪、声学多普勒测速仪、雷达波测速仪等仪器进行测量,虽然具有测量精度高的优点,但是成本高、实时性不够、检测范围窄,难以满足大规模系统部署的需要。随着计算机视觉技术的进步和成本的降低,采用视频图像进行流速检测成为一种可能。在图像
近年来,随着人们生活水平的提高以及饮食习惯的改变,结直肠癌发病率呈增长趋势。由于结直肠癌具有异质性,不同的发展机制和发展阶段都会表现出不同的临床进程,进而影响患者的预后。为此,临床上通过将结直肠癌划分为不同的分子亚型并预测患者生存时间,制定合理的治疗方案,以促进个体化精准治疗。多组学主要包括基因组学、蛋白组学等,反映了癌症发展过程中的生物过程和分子机制,对于患者的病理评估以及治疗方案的制定有着重要