论文部分内容阅读
计算机视觉领域中,对场景中物体的识别及其姿态估计,具有重要作用和极大的应用前景。该技术被广泛应用于机械臂抓取、自动导航和智能监控等科技与工业领域。但是,光照变化、遮挡等复杂环境条件,将极大影响对象识别和姿态估计的精度;此外,在实际应用中算法还需要保障高准确性和实时性,亟待深入研究。相较于普通RGB成像设备,RGB-D传感设备能提供丰富的三维信息,研究基于RGB-D的相关算法,可望在弱纹理与低光照的条件下实现较好的三维对象识别与姿态估计效果。经典的三维对象识别算法通过三维描述子匹配实现对象识别。但是三维描述子仅能用于单个目标的识别,无法做到对复杂结构三维对象进行整体描述。基于神经网络的方法也是对象识别与姿态估计的一个研究热点。此类工作都针对已知对象,需要大量的目标数据进行训练,无法实现未知对象的姿态估计。除此之外,它们还需要复杂的后期优化步骤优化最终结果,很难满足一些高实时性的应用需求。针对上述问题,本文着重对复杂结构三维对象识别与实时未知目标姿态估计进行研究,具体工作如下:1.提出一种基于空间相关性的三维结构描述子,用于对复杂结构三维对象进行识别。对三维场景进行实时稠密SLAM重建,并以凹凸性为判据,将重建场景进行分割,在此基础上,获取目标真实点云,提取目标部件之间的空间相关性以及部件本身的属性信息,构成三维目标的整体描述,最后通过描述子的匹配来识别复杂结构三维目标。在自建数据集上的实验表明本文提出的三维结构描述子具有良好的对象识别效果。2.提出一种未知目标实时跨视场姿态估计方法,能够在大场景中对未知目标进行实时姿态估计与三维点云稀疏重建。该方法通过特定视觉特征AprilTag得到物体相对于初始相机的真实位姿,然后结合跨视场跟踪模块,融合多路RGB-D信息,获取最优输入数据,基于ORB特征点匹配前后帧计算相机当前姿态,最后将相机姿态转化为物体六自由度姿态输出。在仿真数据集上将本文方法与现有姿态估计方法进行定量实验对比,结果表明,本文算法性能对比现有算法有显著提升。在真实场景的定性分析也显示了本文算法的有效性。本文最后对全文工作进行总结,并对下一步工作进行了展望,包括进一步提升三维结构描述子泛化识别性能,以及融合本文所提出的对象识别与姿态估计方法,进一步应用于机械臂分拣、智能监控等场景中。