论文部分内容阅读
支持向量机是建立在统计学习理论和数学规划基础之上的一种数据挖掘的新方法。数学规划是运筹学的一个重要分支,在机器学习、网络问题、工程机械学等领域有着广泛应用。它和数据挖掘技术的结合已使大规模和高复杂性的问题的解决成为可能,并在特征提取、聚类和回归等方面有很重要的应用。支持向量机是数学规划在数据挖掘领域的一个重要应用,是由Vapnik等人根据统计理论提出的一种新的机器学习方法。
本文主要研究了不均衡支持向量机中参数的优化选取问题。支持向量机在各行各业中的应用已经取得了良好的效果;支持向量机的参数选取是支持向量机研究中的一类重要问题,参数选取的不同,对支持向量机的泛化性能影响很大;不均衡支持向量机的参数优化选取的研究较少,本文针对不均衡问题,建立了参数选取的模型,设计了算法,并进行了数值实验。
文中给出了不均衡支持向量机的两个参数选取模型。首先针对不均衡问题的数据上特殊性,摒弃传统的性能评价指标,给出了一个适合不均衡问题的F-指标。通过最小化F一指标来建立优化参数的模型,并用SVM软件包求解。数值实验结果表明了算法的有效性。另外,文中建立了一个具有光滑目标函数的MPEC参数选取模型。该模型是一个具有光滑目标函数的且带有互补约束的非线性规划问题,并在Lingo中编写程序进行数值实验,初步证明了该模型的有效性。