论文部分内容阅读
目标检测与抓取在人们的生产、生活中有着极为广泛的应用,例如智能交通、视频监控、工业自动化等等。在目标检测方面,目前的很多算法往往只对简单的目标有不错的检测效果;但对于复杂背景下的多模态目标,往往很难达到理想的检测效果。在目标抓取方面,很多的方法对于抓取比较单一、简单的目标,成功率很高,而对于复杂的目标,抓取的成功率难以保证。针对上述问题,本文使用多种视觉特征和超限学习机(Extreme Learning Machine,ELM)算法,分别在复杂目标的检测与抓取两个方面展开了研究。在复杂目标检测方面,本文构建了目标-背景二分类器系统,基于滑动窗口法,在测试图像中检测目标所在的区域。在训练和检测过程中,使用梯度方向直方图(Histograms ofOriented Gradient,HOG)和HSV颜色直方图作为特征表达。该目标检测方法的第一个贡献在于构建了一个两级串联的目标-背景二分类系统;第一级分类器是使用HOG特征,第二级分类器使用HSV颜色直方图特征,从而有效地去除了复杂背景对目标检测造成的影响;第二个贡献在于使用了 ELM来训练每一级的二分类器,从而有效地应对了复杂背景所造成的非线性。在目标抓取方面,关键是如何检测目标的抓取点。本文提出了一种抓取点检测算法,该算法使用抓取点-非抓取点二分类器,基于旋转的滑动窗口法,在待检测的目标图像中检测抓取点所在的区域。该二分类器是使用ELM kernel算法进行训练。在训练和检测过程中,使用HOG作为特征表达。该抓取点检测算法的第一个贡献是提出了目标的主方向估计算法,从而在进行抓取点检测时,无需遍历目标的所有角度,只需在目标的主方向上检测抓取点即可;第二个贡献是提出了基于ELM kernel算法的两级级联检测模型,从而有效地去除了复杂的目标形状对抓取点检测造成的影响。本文提出的目标检测系统在PASCAL数据库中进行了实验,该数据库中的目标和背景都很复杂,检测难度很大。本文提出的目标检测系统在该数据库中达到了较高的检测精度。在抓取点检测系统方面,使用的是康奈尔抓取点检测数据库,该数据库中有大量形状复杂的目标,包括杯子、眼镜、螺丝刀等。本文提出的抓取点检测系统在该数据库中的检测准确率达到64.8%,比以往的一些基于深度学习的算法检测精度要高。我们还将本文提出的目标检测与抓取点检测系统应用到机械手臂抓取平台中实验,对各类复杂目标的抓取成功率达到86%。