论文部分内容阅读
预测是数据挖掘中常见的任务之一,它通过训练经验数据集构造和使用模型,来评估样本可能具有的属性值,是统计分析、机器学习、模式识别等领域的一个基本问题。
常见的预测方法如最小二乘法、人工神经网络等算法在预测小样本、高维数、非线性数据集时能力有限;支持向量机(SVM)是建立在小样本统计学习理论之上,在VC维理论和结构风险最小化原则的基础上提出的一种新型机器学习方法,具有数学形式简单、推广能力强、全局最优等优点,受到理论界和工程界的青睐。
本文在比较其它预测算法不足的同时,以支持向量回归(SVR)为主要研究对象,首先较详细介绍了SVM的一些基本原理,概述了一些常用算法。巧妙利用Matlab软件最优化工具箱函数解决SVM训练,简化了算法的编程复杂性,提高了训练速度。SVR有较好的推广能力和极强的非线性系统建模能力,有望解决多特征数据集的回归预测问题,本文尝试将支持向量回归应用于人力资源绩效考核评价预测中。
数据挖掘预处理过程是提高挖掘质量的关键因素之一,因此本文在预处理过程中,仅提取训练样本中指标信息完备、相对合理稳定的样本点,使训练速度有了很大的提高,同时具有较高的拟合精度,增强回归方法的稳健性,降低异常值的影响。
基于以上思想,设计实现了考核评价预测模块,用实际数据进行预测,取得了较好的实验结果。最后分析了不同核参数对预测结果的影响,并将SVR方法与BP神经网络的优缺点进行对比。