论文部分内容阅读
基于优化的分类方法作为数据挖掘领域中的一支新兴的评分方法,由于其算法灵活,精度高,能够反映实际商业问题的需要受到了理论界和实务界的广泛关注。本文在回顾相关研究成果的基础上,比较了现有的数据包络判别分析算法(DEA-DA),多目标线性规划算法(MCLP)和支持向量机算法(SVM),在此基础上提出了一种新的优化分类算法,两阶段多目标线性规划方法(Two-StepMCLP)。使用一个实际的信用数据集,本文采用了十次交叉验证的方法比较了上述模型及其改进型在该数据集上的正确分类率,评分区间分类情况,模型的稳定性等指标,并通过模型之间的相互比较,总结了相关模型的优缺点。在一个生物数据集上,本文使用支持向量机方法来预测抗原和抗体表面残基的距离。本文的研究表明,优化分类算法有很好的判别能力,本文提出的两阶段多目标线性规划方法可以显著提高模型的分类能力和稳定性,各个优化模型在经过一定的调整之后在正确分类能力上有接近的趋势,将不同的算法中的优势相结合可以取得很好的分类效果。