论文部分内容阅读
数据挖掘作为一种融合了人工智能、数据库和数理统计等学科特点的新兴技术,与机器学习和统计学习密切相关。它是从大量、复杂的数据中迅速获取新颖、有效的知识的过程。分类规则挖掘和聚类分析是数据挖掘的重要功能。支持向量机作为一种新兴的统计学习算法,以其优秀的理论基础(结构最小化理论、核空间理论)脱颖而出。它作为结构风险最小化准则的具体实现,支持向量机方法具有全局最优、结构简单、推广能力强等优点。
第一章首先介绍了数据挖掘和支持向量机产生的背景和研究现状。
第二章深入讨论了数据挖掘的任务、处理过程模型以及挖掘中使用较多的一些技术。
第三章深入讨论了支持向量机理论基础学习问题,尤其是对Vapnik等人的统计学习理论SLT结合学习问题作了系统的阐述。
第四章介绍了支持向量机二类别分类算法和支持向量机的训练算法。
第五章对支持向量机多类分类算法的作了研究,全面总结了目前存在的基于支持向量机的多类别分类方法,比较了它们的优缺点及性能。然后基于聚类方法构造了一种层次多分类算法,该算法具有良好的推广能力,决策时间短。
第六章介绍了将支持向量机用于聚类的方法,并推广到2-范数的情况。