论文部分内容阅读
场景分类是20世纪90年代末兴起的一个新的研究领域,近几年成为研究的热点。作为计算机视觉、人工智能、认知科学、数据库、模式识别与人机交互等多学科的交叉技术,场景分类更是得到了广泛的关注。场景分类技术可用于图像检索、移动机器人系统、智能视频监控、医学应用以及军事应用等方面,主要研究如何利用计算机高速、准确、有效地对图像与视频进行诸如分割、识别、分类等工作,使计算机能够根据图像的语义内容,利用无监督方法把图像分类到特定的语义种类中。本文首先总结国内外场景分类的研究现状,然后提出了基于多特征融合的场景分类与标示方法,论文主要分为三大部分:1.图像全局场景的分类与标示方法,介绍了图像中值滤波方法、图像分割算法、图像特征提取与融合方法以及支持向量机分类原理,首先利用中值滤波能够在抑制随机噪声的同时不使边缘模糊,即能够很好的保留图像的边缘信息的这个特性对图像进行滤波处理,然后利用Mean-shift算法对图像进行分割,再对图像进行轮廓提取,并且通过设定轮廓面积阈值与周长阈值对分割后的图像相邻区域进行合并,并对合并后的轮廓进行填充,进一步消除图像中出现的过分割现象,达到比较好的图像分割效果,最后提取分割区域的颜色特征与纹理特征,并将其进行特征融合,输入到SVM分类器中完成对图像全局场景的分类与标示。2.针对传统的单纯运用可见光图像信息,使用目标建模的检测分类方法进行地物分类与标示出现的耗时、准确度不够高的问题,本文提出了可见光与激光雷达图像融合的地物分类与标示的方法,利用可见光图像丰富的纹理信息和激光雷达图像提供的丰富的位置高度信息进行地物分类与标示。首先利用激光雷达图像中地物目标的高程信息确定可见光图像中地物的大体位置区域坐标信息,在后续步骤中仅针对这些区域进行处理,这就大大地缩短了寻找目标区域的时间,并且减少了误检率,然后提取与这些位置区域坐标对应的可见光图像区域,提取这些区域的SURF词袋特征,并输入到SVM分类器中进行类别分类,最终即可完成地物的分类与标示。3.根据本文提出的图像全局场景的分类与标示方法以及可见光与激光雷达图像融合的地物分类与标示方法编写了基于多特征融合的场景分类与标示软件,该软件可以实现对于图像全局场景中对象的分类与标示、图像中地物的分类与标示功能,在软件的最后还完成了模拟无人机飞行时障碍物的分类与凸显任务。