论文部分内容阅读
众所周知,在使用摄像机、摄影机等设备代替人眼识别时,计算机视觉技术十分重要,在近年的计算机科学发展中占据非常重要的部分。而显著性目标检测(Salient Object Detection)作为计算机视觉的预处理步骤,因此有着非常高的研究价值。显著目标检测的任务就是以算法提取图像中人眼可能感兴趣的部分,本质上就是判断图像中各像素属于前景或背景的分类问题。显著目标检测在天文,医学,精加工,公众安全以及军事等领域发挥着重要作用。目前显著目标检测大致分为RGB协同显著目标检测,RGBD协同显著目标检测,RGB单幅图像显著目标检测和RGBD单幅图像显著目标检测等多个领域。本文研究的方向是RGBD单幅图像显著目标检测。RGBD图像显著目标检测旨在利用一对RGB图像和深度图像所提供的信息来计算出视觉上显著可能性最高的目标。近年来,机器学习(Machine Learning)及其衍生的深度学习(Deep Learning)被广泛应用于显著目标检测领域,其关键点是通过利用人工标记的标签训练样本来训练一个分类模型。大量的训练样本直接影响着学习模型的性能。也有许多优秀的针对深度信息的算法被提出。然而遗憾的是许多优秀的有潜力的分类器仅在RGB显著目标检测领域应用广泛,在RGBD显著目标检测领域却仍未得到充分开发。一些机器学习算法的计算流程与显著图的矫正也有完善的空间。基于这些问题,本文做了两个方面的工作。首先,研究了机器学习算法中的支持向量机(Support Vector Machine,SVM)和极限学习机(Extreme Learning Machine,ELM)进行显著目标提取的算法。算法将RGB图像放入已训练好的特征提取模型中,利用CNN提取出高维度的特征信息(4096维)。同时提取多个低级特征,诸如RGB,Depth,LBE等,与高维度信息特征共同作为特征值来对图像区块的颜色、纹理、深度、形状特征进行描述,构成了基于分类器的RGBD显著目标检测算法。其次,本文针对深度信息的性质做了相应的探究,主要分析了深度图的层次性问题,并研究了深度图的层次性在特定场景中的应用。基于人类视觉的特点,对消失点理论进行了扩展应用,提出了基于消失点的深度图显著目标检测算法,并于ELM框架结合,将该深度特征向RGBD显著目标检测做了推广。本文针对RGBD图像的处理,在RGBD-1000,以及NJUDS-2000数据集上进行了测试。测试结果显示,与当前比较先进的几种显著性检测算法相比有一定的优势。