基于RGB-D信息的三维对象识别与姿态估计

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:Monkeysct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉领域中,对场景中物体的识别及其姿态估计,具有重要作用和极大的应用前景。该技术被广泛应用于机械臂抓取、自动导航和智能监控等科技与工业领域。但是,光照变化、遮挡等复杂环境条件,将极大影响对象识别和姿态估计的精度;此外,在实际应用中算法还需要保障高准确性和实时性,亟待深入研究。相较于普通RGB成像设备,RGB-D传感设备能提供丰富的三维信息,研究基于RGB-D的相关算法,可望在弱纹理与低光照的条件下实现较好的三维对象识别与姿态估计效果。经典的三维对象识别算法通过三维描述子匹配实现对象识别。但是三维描述子仅能用于单个目标的识别,无法做到对复杂结构三维对象进行整体描述。基于神经网络的方法也是对象识别与姿态估计的一个研究热点。此类工作都针对已知对象,需要大量的目标数据进行训练,无法实现未知对象的姿态估计。除此之外,它们还需要复杂的后期优化步骤优化最终结果,很难满足一些高实时性的应用需求。针对上述问题,本文着重对复杂结构三维对象识别与实时未知目标姿态估计进行研究,具体工作如下:1.提出一种基于空间相关性的三维结构描述子,用于对复杂结构三维对象进行识别。对三维场景进行实时稠密SLAM重建,并以凹凸性为判据,将重建场景进行分割,在此基础上,获取目标真实点云,提取目标部件之间的空间相关性以及部件本身的属性信息,构成三维目标的整体描述,最后通过描述子的匹配来识别复杂结构三维目标。在自建数据集上的实验表明本文提出的三维结构描述子具有良好的对象识别效果。2.提出一种未知目标实时跨视场姿态估计方法,能够在大场景中对未知目标进行实时姿态估计与三维点云稀疏重建。该方法通过特定视觉特征AprilTag得到物体相对于初始相机的真实位姿,然后结合跨视场跟踪模块,融合多路RGB-D信息,获取最优输入数据,基于ORB特征点匹配前后帧计算相机当前姿态,最后将相机姿态转化为物体六自由度姿态输出。在仿真数据集上将本文方法与现有姿态估计方法进行定量实验对比,结果表明,本文算法性能对比现有算法有显著提升。在真实场景的定性分析也显示了本文算法的有效性。本文最后对全文工作进行总结,并对下一步工作进行了展望,包括进一步提升三维结构描述子泛化识别性能,以及融合本文所提出的对象识别与姿态估计方法,进一步应用于机械臂分拣、智能监控等场景中。
其他文献
随着全球经济的高速发展,化石能源短缺和环境污染问题日益突出。太阳能等可再生能源的开发可以减轻经济增长对能源和环境造成的负担。相变储能技术是利用太阳能热的有效方式,
本文从金土工程的目标出发,简要介绍了金土工程一期建设中的两大业务系统之一----耕地保护国家监管系统的建设目标、系统模型、建设内容与总体结构。
面对香菇分拣过程中出现的人工挑拣和包装劳动量大、生产率低、难以精确控制分级指标等问题,研制了柔索传动的五自由度机械手,用于优质香菇的分拣。设计了整个柔索传动机构,
学生上课期间去厕所需要填写请假条,还要找两位老师签字?近日,云南省临沧市一中的一张课堂特殊请假条引发了网友热议.对此,该校相关老师回应称,这个请假条主要针对的是自制能
在家电等行业中,大量使用JF-FTJ1型粉末静电喷涂机。该机由机械装置和电气控制两大部分组成,其核心为电气控制部分中的高压发生系统。它的组成框图如图1所示。
我公司一台6kV、315kW、8极异步电动机(型号为Y450—8,电动机与设备由一个Ф1.5m皮带轮通过皮带传动)。由高压少油断路器操作起、停。其保护采用DL-12/10型反时限过电流继电器。这
提梁机是高铁建设中所需箱梁的生产、架设的特殊大型施工设备。因自身重量和载重巨大,行走支撑系统对路面不平度的适应和衰减性能直接决定其行走时的稳定性和安全性。在不同
介绍了SY/T 6477-2014标准与之前版本的差异和完善之处,同时介绍了如何运用该标准进行剩余强度评价来确定已知缺陷所允许服役载荷、剩余寿命、检验周期等。为便于工程实际应
在明确筒环类零件(壁薄、外观和尺寸精度要求高)结构特点的基础上,结合数控车床的加工特点,设计一套车削筒环类零件非常有效的夹具.并以镜头环为例说明该夹具的优点、加工可行性及