论文部分内容阅读
支持向量机是以统计学习的VC维理论和结构风险最小化原理为基础的一种机器学习方法,该方法在处理分类问题时表现出许多特有的优势,并且在许多领域得到了广泛的应用。然而作为一种传统方法,支持向量机仍存在很多局限性,因此,研究人员针对其存在的问题进行了深入的研究,并提出了多种改进的算法,例如,模糊支持向量机、结构正则支持向量机、参数间隔支持向量机等。为了进一步提高算法的性能,本文对模糊支持向量机进行了研究,提出了结构模糊支持向量机和具有参数间隔的结构模糊支持向量机。主要研究内容包括:1.将结构信息引入到模糊支持向量机中,提出了结构模糊支持向量机。尽管传统的模糊支持向量机将模糊理论应用到了支持向量机中,通过模糊隶属度体现了不同的样本对最优分类面的产生所起到的作用程度不同,较好地解决了噪声或异常点对支持向量机的影响,但是,该算法主要利用了数据集中类间的可分性,却忽略了数据集中类内的结构信息对分类的作用,因此,在深入研究模糊支持向量机和结构正则支持向量机的基础上,将结构信息引入到模糊支持向量机中,提出了结构模糊支持向量机模型,该方法不仅通过使用模糊隶属度表明不同样本对支持向量机的作用,而且利用类内的结构信息进一步提高分类器的泛化性能。2.将参数间隔引入到结构模糊支持向量机中,提出了具有参数间隔的结构模糊支持向量机。针对数据集中存在的异质噪声,易使得分类边缘呈现不规则形状问题,在结构模糊支持向量机的基础上,通过考虑异质噪声对模型的影响,提出了具有参数间隔的结构模糊支持向量机模型,以此进一步提高支持向量机的分类正确率。3.针对提出的结构模糊支持向量机和具有参数间隔的结构模糊支持向量机模型,利用拉格朗日乘子法,从理论上导出了结构模糊支持向量机、结构v-模糊支持向量机以及具有参数间隔的结构模糊支持向量机的分类器,同时,将核策略引入到提出的模型中,并对其进行了求解,以此解决较复杂数据的分类。4.通过选取UCI和Statlog数据库中的标准数据集,并通过计算类内离散度获取结构信息,实验研究了结构模糊支持向量机和具有参数间隔的结构模糊支持向量机的性能,并与支持向量机、模糊支持向量机、结构正则支持向量机、参数间隔支持向量机等方法的性能进行比较。