论文部分内容阅读
[摘 要]本文将机器学习中最常用的两种分类算法——K近邻法和支持向量机应用到纹理识别的研究中,以Outex、Brodatz以及CUReT三个公共纹理库中的纹理图像为研究对象,分别使用K近邻法、支持向量机算法进行纹理识别实验,并对最终的识别结果做了分析与比较。综合三个纹理库的识别结果,我们发现相较于K近邻法,支持向量机的识别效果较好,能够较准确的实现对纹理图像的识别。
[关键词]K近邻法;支持向量机;纹理识别
中图分类号:TP392.01 文献标识码:A 文章编号:1009-914X(2014)20-0286-01
1.引言
计算机视觉是当前计算机学科研究中比较重要的一个分支,其最终目的是让计算机系统能够准确理解三维世界中的事物,使之具备人眼视觉的某些功能。因此,计算机视觉的研究对人工智能、工业智能等领域的发展有着十分重要的意义。纹理识别是计算机视觉中最具挑战性的领域之一,它在物体识别、遥感图像分析、工业自动化处理、海洋生态研究等多个方面都有着广泛的应用。这样,纹理识别在自动化生产、机器人智能化等方面也具有相当重要的研究意义与应用价值。
本文以Outex、Brodatz以及CUReT三个公共纹理库中的纹理图像为研究对象,将K近邻法和支持向量机这两种分类算法应用到纹理识别实验中,对两种算法的纹理识别效果及优缺点做了详细对比、分析。下面首先介绍一下K近邻法与支持向量机的基本原理。
2. 原理介绍
2.1 K近邻法
K近邻法是一种在概率统计基础上被提出的算法,主要通过对训练样本进行概率密度统计来实现对待测样本的分类。该算法不需要任何诸如条件性独立之类的假设做前提条件,而是直接对已有的样本数据集进行学习、分类。因此,K近邻法是一种没有参数的密度估计算法。
K近邻法的主要思想是首先对类别未知的样本和训练样本集做距离度量;接着,比较这些距离的大小,取其中前K个最短距离即离待测样本最近的训练样本作为它的邻居;最后,取这K个邻居的类标进行投票,将票数最多即出现次数最多的类标赋给当前待测样本,此时即已完成对待测样本的分类。
2.2 支持向量机
支持向量机主要通过对整个训练样本集进行学习来获得使分类间隔达到最大的支持向量。其中,如图1所示,直线和之间的距离即为分类间隔,而和分别经过的实心点和空心点表示的训练样本即为支持向量。以两分类问题为例,支持向量机是一种在线性可分的前提下,寻找能将训练样本划分为两种类别的最优分类线的算法。这里所说的“线性可分”是指存在一直线或超平面,能够直接将训练样本集分为两种类别;“最优分类线”即为图1中将实心点与空心点区分开来的直线,而图中所示的和分别代表的是经过与直线距离最短的实心点和空心点的两条直线,同时这两条直线还与直线平行。如图1所示,当直线使“margin”最大,即直线与之间的分类间隔最大时,直线就是最优分类线,而支持向量就是分布在和上的训练样本。
3. 实验及结果分析
实验中我们首先对Outex、Brodatz以及CUReT三个公共纹理库中的纹理图像进行特征提取,并对获得的特征向量使用PCA算法进行降维,最终以10个特征值来表示一幅纹理图像。接着,将纹理图像分为训练样本与待测样本两部分,分别使用K近邻法、支持向量机对训练样本进行学习,对待测样本进行纹理识别。
此外,我们对K近邻法不同的K值,支持向量机不同的核函数、核参数均进行了多次选取,得到的识别结果显示,不同K值的选取对K近邻法的识别效果影响较大,核函数及核参数的选取同样影响了支持向量机最终的识别效果。表1为两种方法对三种纹理库中纹理图像的平均识别准确率。从总体上看,支持向量机的纹理识别效果优于K近邻法的识别效果。因此,在纹理识别方面,支持向量机的性能相较于K近邻法要好一些。
4. 结束语
本文将K近邻法与支持向量机两种常用的分类算法应用到纹理识别实验中,对Outex、Brodatz以及CUReT三个公共纹理库中的纹理图像进行识别。文中通过分析、对比两种分类算法最终的识别结果,得到支持向量机的纹理识别效果优于K近邻法的识别效果的结论。
本文由“海洋地球物理声学探测数据处理和管理技术及产品应用(201005029)”、国家海洋公益性行业科研专项经费项目“渤海海洋环境信息集成及动态管理技术示范应用(200905030)”与青岛市科技计划基础研究项目(Qingdao Science and Technology Plan Projects)2012.1-2014.9“水下小目标空间几何及三维纹理重建系统研究(12-1-4-1-(8)-jch)”资助。
[关键词]K近邻法;支持向量机;纹理识别
中图分类号:TP392.01 文献标识码:A 文章编号:1009-914X(2014)20-0286-01
1.引言
计算机视觉是当前计算机学科研究中比较重要的一个分支,其最终目的是让计算机系统能够准确理解三维世界中的事物,使之具备人眼视觉的某些功能。因此,计算机视觉的研究对人工智能、工业智能等领域的发展有着十分重要的意义。纹理识别是计算机视觉中最具挑战性的领域之一,它在物体识别、遥感图像分析、工业自动化处理、海洋生态研究等多个方面都有着广泛的应用。这样,纹理识别在自动化生产、机器人智能化等方面也具有相当重要的研究意义与应用价值。
本文以Outex、Brodatz以及CUReT三个公共纹理库中的纹理图像为研究对象,将K近邻法和支持向量机这两种分类算法应用到纹理识别实验中,对两种算法的纹理识别效果及优缺点做了详细对比、分析。下面首先介绍一下K近邻法与支持向量机的基本原理。
2. 原理介绍
2.1 K近邻法
K近邻法是一种在概率统计基础上被提出的算法,主要通过对训练样本进行概率密度统计来实现对待测样本的分类。该算法不需要任何诸如条件性独立之类的假设做前提条件,而是直接对已有的样本数据集进行学习、分类。因此,K近邻法是一种没有参数的密度估计算法。
K近邻法的主要思想是首先对类别未知的样本和训练样本集做距离度量;接着,比较这些距离的大小,取其中前K个最短距离即离待测样本最近的训练样本作为它的邻居;最后,取这K个邻居的类标进行投票,将票数最多即出现次数最多的类标赋给当前待测样本,此时即已完成对待测样本的分类。
2.2 支持向量机
支持向量机主要通过对整个训练样本集进行学习来获得使分类间隔达到最大的支持向量。其中,如图1所示,直线和之间的距离即为分类间隔,而和分别经过的实心点和空心点表示的训练样本即为支持向量。以两分类问题为例,支持向量机是一种在线性可分的前提下,寻找能将训练样本划分为两种类别的最优分类线的算法。这里所说的“线性可分”是指存在一直线或超平面,能够直接将训练样本集分为两种类别;“最优分类线”即为图1中将实心点与空心点区分开来的直线,而图中所示的和分别代表的是经过与直线距离最短的实心点和空心点的两条直线,同时这两条直线还与直线平行。如图1所示,当直线使“margin”最大,即直线与之间的分类间隔最大时,直线就是最优分类线,而支持向量就是分布在和上的训练样本。
3. 实验及结果分析
实验中我们首先对Outex、Brodatz以及CUReT三个公共纹理库中的纹理图像进行特征提取,并对获得的特征向量使用PCA算法进行降维,最终以10个特征值来表示一幅纹理图像。接着,将纹理图像分为训练样本与待测样本两部分,分别使用K近邻法、支持向量机对训练样本进行学习,对待测样本进行纹理识别。
此外,我们对K近邻法不同的K值,支持向量机不同的核函数、核参数均进行了多次选取,得到的识别结果显示,不同K值的选取对K近邻法的识别效果影响较大,核函数及核参数的选取同样影响了支持向量机最终的识别效果。表1为两种方法对三种纹理库中纹理图像的平均识别准确率。从总体上看,支持向量机的纹理识别效果优于K近邻法的识别效果。因此,在纹理识别方面,支持向量机的性能相较于K近邻法要好一些。
4. 结束语
本文将K近邻法与支持向量机两种常用的分类算法应用到纹理识别实验中,对Outex、Brodatz以及CUReT三个公共纹理库中的纹理图像进行识别。文中通过分析、对比两种分类算法最终的识别结果,得到支持向量机的纹理识别效果优于K近邻法的识别效果的结论。
本文由“海洋地球物理声学探测数据处理和管理技术及产品应用(201005029)”、国家海洋公益性行业科研专项经费项目“渤海海洋环境信息集成及动态管理技术示范应用(200905030)”与青岛市科技计划基础研究项目(Qingdao Science and Technology Plan Projects)2012.1-2014.9“水下小目标空间几何及三维纹理重建系统研究(12-1-4-1-(8)-jch)”资助。