论文部分内容阅读
支持向量机(Support Vector Machine,SVM)以最优化理论和统计学理论作为理论基础,是一种性能良好的机器学习方法,有效地解决了局部极小点、小样本、非线性等实际问题,目前已成功应用于模式识别、回归预测等诸多领域,有力的推动了机器学习理论与应用的发展。由于传统支持向量机对噪点或野值点敏感,往往会影响分类性能,对此,国内外学者将模糊隶属度函数引入,构造了模糊支持向量机模型,赋予样本点以不同的惩罚程度,从而有效地降低了噪点或野值点对传统支持向量机带来的影响,提高了分类问题的鲁棒性。隶属度函数直接影响到模糊支持向量机的性能,因此如何构造是其重点,也是难点,目前尚未见统一的标准。本文主要针对以上不足之处,对模糊支持向量机算法(Fuzzy Support Vector Machine,FSVM)进行了研究与改进,随后将其应用到数据实验中,验证了其有效性。本文的主要工作有:1.较为详细的介绍了SVM和FSVM相关理论知识,主要包括模型的产生、推导、演变以及其各自的非线性推广,在FSVM部分更是给出了模糊支持向量机模型中涉及到的模糊数学中相关定义及定理。2.提出一种基于样本与超平面距离的隶属函数的构造方法,并将隶属度作为权值引入模糊支持向量机模型,构造出了一种基于与超平面距离的隶属度加权模糊支持向量机模型(IFM-WFSVM),并在人工数据集和UCI数据集上分别验证了该算法的有效性。3.提出一种基于DP聚类(Clustering by Fast Search and Find of Density Peaks)的隶属函数的构造方法,同样将隶属度作为权值引入模糊支持向量机模型,构造了一种基于DP聚类的隶属度加权模糊支持向量机模型(DP-WFSVM),并给出了实验对比和性能分析,获得了很好的分类效果。本文运用统计学习理论、模糊数学理论、FSVM理论、分类超平面的性质、DP聚类算法等理论支持和技术,实现了对模糊支持向量机的改进,具有很好的改进意义和分类性能。