基于支持向量机的数据挖掘预测算法的研究与应用

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zxy556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测是数据挖掘中常见的任务之一,它通过训练经验数据集构造和使用模型,来评估样本可能具有的属性值,是统计分析、机器学习、模式识别等领域的一个基本问题。 常见的预测方法如最小二乘法、人工神经网络等算法在预测小样本、高维数、非线性数据集时能力有限;支持向量机(SVM)是建立在小样本统计学习理论之上,在VC维理论和结构风险最小化原则的基础上提出的一种新型机器学习方法,具有数学形式简单、推广能力强、全局最优等优点,受到理论界和工程界的青睐。 本文在比较其它预测算法不足的同时,以支持向量回归(SVR)为主要研究对象,首先较详细介绍了SVM的一些基本原理,概述了一些常用算法。巧妙利用Matlab软件最优化工具箱函数解决SVM训练,简化了算法的编程复杂性,提高了训练速度。SVR有较好的推广能力和极强的非线性系统建模能力,有望解决多特征数据集的回归预测问题,本文尝试将支持向量回归应用于人力资源绩效考核评价预测中。 数据挖掘预处理过程是提高挖掘质量的关键因素之一,因此本文在预处理过程中,仅提取训练样本中指标信息完备、相对合理稳定的样本点,使训练速度有了很大的提高,同时具有较高的拟合精度,增强回归方法的稳健性,降低异常值的影响。 基于以上思想,设计实现了考核评价预测模块,用实际数据进行预测,取得了较好的实验结果。最后分析了不同核参数对预测结果的影响,并将SVR方法与BP神经网络的优缺点进行对比。
其他文献
嵌入式技术的飞速发展,特别是嵌入式技术和Internet技术的结合,很多嵌入式系统将不再是一个个孤立的系统,系统的互联使得信息安全问题变得更加突出。传统的嵌入式操作系统安全性
进化测试是一种以自动生成高质量测试数据为目的的新兴的测试技术,已被成功应用于工程实践中。进化测试的基本思想就是将在不同覆盖准则下的测试数据生成问题转化成一个全局
蛋白质折叠结构预测问题是生物信息科学提出的基本的理论性问题。求解该问题具有生命认知科学理论上和在疾病治疗和药物研究上的意义。应用现有的仪器和手段来测定已知的大量
在电信事业蓬勃发展的今天,综合化、分布化、智能化已经成为电信网络管理技术发展的方向。电信管理网(Teleconununications Management Network,TMN)作为一个国际通行的电信管
随着J2EE技术的迅速普及,Struts+Spirng+Hibernate这种整合框架,以其开发效率高,易于系统重构和代码重用且都是开源免费,而逐渐被开发者广泛地应用于中小型J2EE的项目中。所以,为
视频监控系统几乎遍布了城市中的每个角落,不间断地记录着城市发生的一切。监控摄像头为社会安全提供重要保障,同时也带来了海量的视频数据。如何快速从海量视频数据中提取有
目前,越来越多的企业希望通过建立企业级的单点登录系统和安全防护系统,为企业用户提供统一的信息资源认证访问入口,建立统一的、基于角色的和个性化的信息访问与集成平台;通
随着宽带网络接入的普及,很多企业都可以采用多种方式上网,这些方式包括电话线拨号、ADSL、无线接入等。在一些远离城市的地方,可能这些企事业单位只能申请ADSL、无线、甚至
网络和信息技术的迅猛发展,对人们的工作方式和生活方式产生了巨大的影响。计算机网络带来方便、快捷的同时,也带来了日趋严重的安全问题。由于技术原因和人为攻击等因素,网
近年来,P2P技术的发展促进了它在许多领域的深入应用,特别是与流媒体技术的融合导致了P2PStreaming这一新兴技术的产生和发展。P2PStreaming技术利用P2P技术的优点,能够有效