论文部分内容阅读
场景理解指的是让计算机模拟人的生理视觉感知原理对图像做出有效的解释。场景分类是场景理解中的一个重要研究方向。作为数字图像处理、人工智能、计算机视觉、人机交互、模式识别等多学科的交叉学科,场景分类在众多领域都扮演着重要的角色。众多研究人员不断提出各种用于场景分类的方法。概括来讲,场景分类包括两大类型,一种是对整幅图像所属的场景类别进行分类,另外一种是对场景中的目标进行分类。由于无人机具有轻巧便捷、成本较低、相对安全等优势,基于视觉的无人机在各个领域发挥着越来越重要的作用。研究空对地场景中目标的分类能够将场景中的目标、障碍物、感兴趣区域等实时的进行分类与标示,可以给予无人机或者操作员更多的飞行环境信息,对于无人机的安全飞行有着重要的现实意义。本文采用基于特征提取的方法进行空对地场景中目标分类的研究,主要工作包括四部分: 第一,场景中特定目标的分类。在该部分,首先介绍了常用的目标特征提取方法,AdaBoost级联分类器的实现原理。重点介绍了Haar-like特征和LBP特征以及它们的提取过程。然后将Haar-like特征和LBP特征分别与AdaBoost相结合实现空对地场景中特定目标的分类,并通过实验结果对这两种方法进行了对比分析。 第二,基于多特征融合的目标分类。在该部分,介绍了HOG特征、SVM分类原理、特征融合的概念。在融合特征的处理过程中,首先需要完成HOG特征与LBP特征的提取,得到这两种特征向量之后,分别将两种特征向量进行归一化处理,使用归一化后的特征向量进行特征融合。利用融合之后特征来训练分类器,实现空对地场景中目标的分类。 第三,视觉显著性与特征袋相结合的目标分类。在该部分,首先介绍了相关的基础知识,包括:SIFT特征、K-means算法、Mean-shift算法等。在分类器训练阶段,提取样本图像的SIFT特征,利用K-means聚类算法形成特征袋,将SIFT特征袋送入SVM分类器进行训练。在目标分类阶段,首先利用FT显著性检测模型和Mean-shift分割方法将场景中显著性物体分割出来。然后对得到的显著性物体分割图像进行SIFT特征袋的提取,载入训练好的分类器实现场景中目标的分类。 第四,复杂场景分类与标示软件的实现。在该部分,将以上三部分集成在同一个界面下,通过C++语言的编写实现一个运行稳定的软件。该软件可以完成空对地场景中目标的分类与标示,处理结果与各项参数可直观的显示在界面中。