基于支持向量机的数据挖掘模型研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:A511429239
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘作为一种融合了人工智能、数据库和数理统计等学科特点的新兴技术,与机器学习和统计学习密切相关。它是从大量、复杂的数据中迅速获取新颖、有效的知识的过程。分类规则挖掘和聚类分析是数据挖掘的重要功能。支持向量机作为一种新兴的统计学习算法,以其优秀的理论基础(结构最小化理论、核空间理论)脱颖而出。它作为结构风险最小化准则的具体实现,支持向量机方法具有全局最优、结构简单、推广能力强等优点。 第一章首先介绍了数据挖掘和支持向量机产生的背景和研究现状。 第二章深入讨论了数据挖掘的任务、处理过程模型以及挖掘中使用较多的一些技术。 第三章深入讨论了支持向量机理论基础学习问题,尤其是对Vapnik等人的统计学习理论SLT结合学习问题作了系统的阐述。 第四章介绍了支持向量机二类别分类算法和支持向量机的训练算法。 第五章对支持向量机多类分类算法的作了研究,全面总结了目前存在的基于支持向量机的多类别分类方法,比较了它们的优缺点及性能。然后基于聚类方法构造了一种层次多分类算法,该算法具有良好的推广能力,决策时间短。 第六章介绍了将支持向量机用于聚类的方法,并推广到2-范数的情况。
其他文献
学位
随着信息技术的不断发展和应用,信息的安全性变得越来越重要。相关网络安全协议应运而生,而它们的基础都是安全有效的加密算法。椭圆曲线密码系统与其他公钥加密系统相比有很
J2EE以其规范的开放性、平台无关性、较好的可移植性、可扩展性以及多层分布式计算等诸多优点,正被越来越多地应用到航天卫星地面应用工程中来。本论文所研究的遥感卫星数据浏
随着计算机技术的高速发展,企业的应用系统和以往相比,有了很大的进步。企业级的应用不再局限于以往的单机系统或简单的客户端/服务器系统,而是逐渐向着三层、多层体系结构的分
Web数据库技术是Internet技术和数据库技术共同的发展方向,也是Internet应用研究的关键。WWW是Internet上最主要的信息服务方式,WWW系统和数据库是网络化信息服务的基础,数据库
分布式对象技术的出现弥补了传统分布计算技术的固有缺陷。经过几年的发展,分布式对象技术逐渐走向成熟。Sun公司提出的EJB模型作为最新的分布式对象计算模式,为开发服务器端的
聚类是知识工程和模式识别中一个重要的研究领域,在对大量数据进行分析和处理时有其独特的地位。聚类领域方面的研究经过上世纪80到90年代的突飞猛进的发展之后,产生了种类和用
本论文是基于HLAC4ISR军用通信网仿真预研课题的一部分,C4ISR是指挥、控制、通信、计算机、情报、监视、侦察。C4ISR是一个复杂的系统,其中包括军用通信网系统。本论文是这个复
用户界面向着更加自然、个性化、智能化的方向发展,其发展趋势很大程度上取决于用户的现实需求和计算机技术的进步这两个推动力。人机交互研究者比以往更加关注认知科学,希望建
随着软件技术的发展,传统的面向功能开发方法己渐渐不适应越来越复杂多变的需求。目前,面向对象的开发方法己经成为软件开发的主流技术。统一建模语言(UML)是一种对面向对象系