论文部分内容阅读
随着科技的进步,家庭服务机器人将拥有更加广阔的市场前景。对于工作在环境复杂中的机器人,快速有效的场景识别能够让机器人很好地感知和理解场景环境,这是机器人要实现自主导航和探索环境的先决条件。知道机器人当前场景语义(情景)类别不仅仅能帮助机器人的导航,同时也大大提高了其理解场景和更好地服务于人类的能力。本论文主要针对的是视觉场景分类(VPC)问题,其中提到使用在有自主能力的机器人平台上收集到的视觉信息来预测地方的场景类别。由于场景图像具有随机的、多种多样的、复杂的等特点,且对复杂环境中多类物体的识别技术仍不成熟,因此如何设计有效的场景图像处理方法成为机器视觉领域仍然极具挑战性和探索性的热点问题。支持向量机算法是在严谨的理论基础之上建立起来的,在解决样本很小、不是线性而且维数又高的模式识别问题中有它特有的优势,在识别准确率和处理时间上都表现出优越性。近年来,SVM已被成功地应用于模式辨识、分类、以及回归分析等研究领域。然而,现有的支持向量机应用研究忽视了一个问题,那就是如何将专家逻辑经验与SVM方法有效结合起来。在实际的工程应用中,我们通常对某些待分析的数据信号拥有一定的先验知识。因此,研究一种新的把支持向量机和专家先验知识有效结合起来的模糊支持向量模型,是SVM算法面向工程应用领域一个急需解决的重要问题。本文结合场景图像分类的实际应用背景,研究了SIFT特征提取算法和模糊SVM算法的一些相关问题。论文的主要工作及研究如下:首先,本文介绍了图像场景分类一些相关的背景知识,以及对其进行研究的意义;分析了视觉机器人、图像场景分类、支持向量机和视觉字典容量获取等的研究现状。其次,本文罗列了图像场景分类的流程设计。阐述了SIFT (Scale-invariant feature transform,尺度不变特征转换)特征和CTH (Census Transform Histogram,统计变换直方图)特征提取的详细过程;并且通过对比,简单分析了K-均值聚类和AP聚类算法分别对应的优缺点:K-均值聚类算法需要人为设定聚类中心数目,而且会因为初始聚类中心的不同会导致聚类结果的不同。而AP聚类算法则是通过算法的迭代自动来获取聚类中心,而且在整个迭代过程,经过44次就趋于稳定。因此,本文直接选用AP聚类算法来生成视觉字典、并且获取到视觉字典的容量。此外,还分析了AP聚类算法中的两个参数对聚类结果的影响。第三,本文对场景图像特征的提取方法进行了深入研究,给出了SIFT特征的获取和CTH特征获取的两种特征描述方法。分别详细讲述了这两种方法的具体原理和过程,包括经典的SIFT特征提取、改进的SIFT特征提取以及使用均匀网格法提取SIFT特征;统计变换算法、统计变换直方图算法和提取CTH特征向量的步骤。然后在第五章实验对这两种特征描述方法的分类效果进行比较。最后,介绍了PCA-SIFT算子的获取以及对获取PCA-SIFT算子后对数据的预处理。第四,本文首先对提取到的特征矩阵数据进行了预处理。然后介绍了聚类算法的设计部分,以及用AP聚类算法获取视觉字典容量的流程,最后使用SVM分类器实现图像的场景分类。使用AP聚类算法得到了视觉字典容量和识别率之间存在的一条关系曲线。然后改变AP聚类算法的参数—参考度P,分析了不同参数对场景分类结果的可能影响。并利用IGP (In-Group Proportion,类内比例)准则来评价AP聚类的性能。第五,进行了实验仿真,并且对实验的结果作了详细的解析。最先,使用AP聚类算法获得了视觉字典容量与识别准确率间的关系曲线。实验数据说明:利用AP聚类可以快速生成视觉字典和获取其容量,并且实现分类的准确率也很高,可以达到80%以上。本文还给出了几个重要的参数对实验结果的影响,通过IGP的值选择参考度的值,验证了AP聚类的有效性和得到的视觉字典容量的合理性。最后,对比了SIFT特征描述和CTH特征向量描述这两种特征提取方法,对场景图像分类的不同效果,通过数据证明了CTH特征可以更准确而且快速地实现图像场景分类。第六,对本文所做的工作做出了总结,并给出了后续的研究建议和方向。