论文部分内容阅读
随着人们对机器学习(LM)理论的深入研究和对数据挖掘(DM)技术的不断改进,在九十年代初期由Vapnik.V等人提出了支撑向量机(SVM)技术。它是建立在统计学习理论基础(SLT)之上的,借助最优化方法来解决机器学习理论和数据挖掘中问题的新方法。与传统的统计学和人工神经网络(ANN)不同的是,支撑向量机主要是研究中小样本条件下的统计学习规律和方法,并且它所采用的样本不像是在统计学中那样为了某个目标而专门生成的样本。实践表明,以统计学习理论为基础的支撑向量机不仅结构简单,而且具有很强的理论和实践推广能力。目前,关于支撑向量机的研究工作已经成为了国际人工智能、数据库等领域的热点问题。本文深入系统的对支撑向量机技术进行了探讨。本论文的主要工作如下:首先,在第一章中简单了介绍了机器学习和数据挖掘理论的基本概念和目前国际上关于它们的研究情况,并概括性地引进了支撑向量机技术。接下来的第二章介绍了统计学中的回归问题,如线性回归、log istic回归等问题的模型。再次,在论文第三部分中,把前两章中的支撑向量机技术和回归分析问题结合起来,系统的讨论了支撑向量机中的数据回归方法,同时运用最优化工具把问题简化,得到了结构简单合理的问题模型。最后,为了解决在支撑向量机数据回归方法中的不光滑性,特别是在一些拐点上的不可微问题,在文中第四章系统的研究了光滑技术在支撑向量机回归问题中应用,给出了三个在理论和实践中都具有很好性能的光滑的支撑向量机回归方法。目前,关于支撑向量机问题的研究主要是从统计学、人工智能、数据库方面入手,而对支撑向量机回归问题的光滑性进行研究的工作比较少。因此,本文对支撑向量机技术的研究无论是在理论还是在实际应用方面的,都具有重要的意义。