论文部分内容阅读
计算机视觉是上世纪七十年代兴起,在工业界,由于传感器的简单易用,信息丰富以及成本低廉,使得工业任务越来越多得偏向于使用计算机视觉。基于视觉的目标检测需从图像中提取出稳定不变的元素,这通常是通过稳定的点特征或对图像模板进行编码来实现。目标定位是和目标检测密不可分的两个任务,虽然在目标检测的同时就可以完成粗糙定位,但是工业应用中往往对精度有苛刻要求,高精度的目标定位属于图像配准领域范畴,由于噪声,光照等因素的存在,也为图像配准带来了难度,衍生了不同种类的图像配准算法。本文对常见的目标检测及图像配准进行了回顾和总结,对现有算法提出了改进,设计并完成了面向工业物体的快速,比较鲁棒的,精确的图像配准算法。论文的主要研究内容和成果如下:1.面向目标定位的形状上下文描述子。针对工业应用中目标纹理较少的情况,本文改进了前人的工作,提出了一种Shape Context描述子的改良,通过引入更高精度的采样,更高维度的柱状图表达,额外的角度信息的加入,能够对少纹理的物体进行形状上的详细特征描述。2.面向工业应用的亚像素配准算法。本文总结了基于图像灰度的Lucas-Kanade框架,以及基于图像空间信息的ICP框架,针对工业应用中的对速度的额外要求,本文采用不同的距离度量,为ICP算法中的数据点引入新的维度,结合KD-tree编码加速图像配准,实现了面向多纹理物体和少多纹理物体的亚像素精度检测。3.针对单目摄像的人体姿态估计框架。本文吸纳了多目摄像下的人体姿态估计的框架,尝试在只有单目摄像机拍摄下,人体信息严重缺少的情况下,完成3维尺度上的人体骨架模型重建,并未后续的人体重构与跟踪,以及动作行为识别打下基础。