【摘 要】
:
室内定位在人们的生活、工作与学习中扮演着重要的角色,为人们的衣食住行提供着巨大的便利。主流的室内定位技术针对不同场合使用不同的定位方法,面临着场景应用中的各种功耗、成本、定位精度低等局限性问题。随着计算机视觉技术的不断发展,深度学习方法为室内场景重定位提供了一种新的基于视觉的重定位技术。提出一种基于级联深度神经网络的场景重定位算法,只需输入单张RGB图片,即可给出该张图片的相机姿态,实现场景的重定
论文部分内容阅读
室内定位在人们的生活、工作与学习中扮演着重要的角色,为人们的衣食住行提供着巨大的便利。主流的室内定位技术针对不同场合使用不同的定位方法,面临着场景应用中的各种功耗、成本、定位精度低等局限性问题。随着计算机视觉技术的不断发展,深度学习方法为室内场景重定位提供了一种新的基于视觉的重定位技术。提出一种基于级联深度神经网络的场景重定位算法,只需输入单张RGB图片,即可给出该张图片的相机姿态,实现场景的重定位。通过对室内场景重定位问题形式化描述,利用卷积神经网络设计一种姿态检索模型,并采用一种同方差不确定性损失进行监督训练,让网络理解提取场景中的各种空间信息、语义信息等,构造一个姿态检索特征库。然后,再提出一种基于深度神经网络的点匹配模型,让网络充分理解提取场景中的点特征,来替代传统手工特征的提取与匹配,并构造一个地图点特征库。进而,利用该级联网络,将测试图片的姿态特征,在地图姿态特征库中检索与其最近的Top K张图片,从而极大的缩小场景估计范围。再用这检索的库图片所对应的地图点特征与测试图片使用点匹配网络提取的点特征进行匹配,提供一种更加精确高效的匹配特征点,最后联合多视图几何法,端到端的估计出该张图片的相机姿态,实现室内场景的重定位。将使用姿态检索模型直接回归的方式,同使用级联网络进行检索匹配并联合多视图几何的算法,和现有的代表算法,在相同的7-Scenes数据集下进行实验。结果显示,使用级联神经网络对姿态特征进行检索与匹配的方法,要优于直接使用神经网络进行回归的算法,与Pose Net、Pose LSTM等相比较,平移误差和旋转误差都有显著的降低,算法精确度提升明显。
其他文献
砷和铬是广泛分布于自然界的重金属污染元素,在水环境中毒性大,不仅能对水生生物造成了严重的伤害,也会威胁到人们的身体健康甚至生命安全。在水资源严重缺乏的今天,寻求一种高效去除水中砷和铬的技术势在必行。在众多去除砷和铬的方法中,吸附法是一种经济而有效的方法。近年来,开发含有多种金属氧化物的复合吸附剂受到了广泛的关注,因为复合吸附剂具有明显的协同效应。而稀土基吸附剂由于其表面富含羟基,对含氧酸阴离子具有
倍福凭借TwinCAT HMI软件拉开了新一代HMI软件的序幕。与以往使用需要特定操作系统的专用工程和通信系统不同,倍福现在能够采用诸多IT标准,如Visual Studio用于项目开发,HTML5用于界面设计,以及HTTPS用于安全通信。无论用户使用哪种操作系统、分辨率或显示器,用户界面都可以在任何支持HTML5的浏览器上执行。
茶(Camellia sinensis)是一种在世界范围内广受欢迎的饮料,也是最重要的功能性食品之一。乌龙茶是一种高品质的半发酵茶,其制茶工序包括采摘、萎凋、摇青、炒青、揉捻和干燥。在制茶过程中,茶叶中的化学成分发生了 一定的变化,以儿茶素的酶促氧化为主,主要生成了儿茶素氧化聚合产物——聚酯型儿茶素(Theasinensins,TSs)。其中,聚酯型儿茶素A(TSA)和聚酯型儿茶素B(TSB)是主
基于惯性测量单元的实时定位与建图(Simultaneous Localization And Mapping,SLAM),即视觉惯性SLAM,是机器人定位、自动驾驶等领域的关键技术,该技术建立了物体在现实世界中的运动轨迹的数学模型。本文主要讨论了基于稀疏地图的嵌入式视觉惯性SLAM系统。在嵌入式平台上,单目相机采集图像流,经过特征提取与匹配输出图像特征匹配,惯性测量单元(Inertial Meas
灵敏的X射线探测器在医学诊断、安全筛查和工业产品检验中有着至关重要的意义。Cs2Ag BiX6和Cs3Bi2X9无铅钙钛矿材料由于具有较高的稳定性且无毒,并且表现出较高的灵敏度和较低的检测限,有望大量应用于X射线探测领域。本文主要在化学计量比基础上,通过添加不同的溶质和溶剂的方式,研究了不同添加剂对Cs2AgBiBr6晶体尺寸以及性能的影响,同时研究了低维钙钛矿Cs3Bi2X9晶体的生长以及光电性