论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是近年来受到广泛关注的一类学习机器,它以统计学习理论(Statistical Learning Theory,SLT)为基础,具有简洁的数学形式、标准快捷的训练方法和良好的泛化性能,已广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题。但在SVM的研究中仍然存在许多问题尚待解决,例如模型选择问题、针对大规模训练集的学习效率问题、经验知识与SVM的融合问题等。目前在SVM的学习训练过程中,几乎所有的信息都来源于训练样本集,如果将经验知识融合于SVM的研究,将会大大提高SVM的泛化能力。如何提取有用的经验知识及经验知识在SVM学习过程中的应用是经验知识与SVM融合问题的重点,也是难点。本文对经验知识与SVM融合问题进行了系统的研究,主要内容如下:(1)对现有经验知识与SVM的融合方法进行了详细的分析和研究。(2)提出了基于最佳逼近点的不变性常识与SVM的融合方法。目前对于经验知识的研究主要集中在对于分类问题的不变性常识的研究,已提出的不变性常识与SVM的融合方法虽然可以完成不变性常识与SVM的融合目的,但是各方法存在不同的缺点,有的方法对不变性变换有严格限制,有的方法求解优化问题的计算代价过大,或者融合方法较难实现,算法复杂度过高。本文通过最佳逼近点来代表不变性变换形成的轨迹簇,适当增加样本集容量,达到不变性常识与SVM融合的目的,算法简单,容易实现并且算法计算代价不是很大。该方法的提出是基于SVM最大化分类间隔的原则,因此可以很好地实现不变性常识与SVM的融合任务。(3)提出了基于最佳逼近点的不变性常识与SVM融合方法的模型及实现算法。论文在人工数据集和真实数据集上进行了测试,验证了该方法的可行性和有效性。(4)针对时序数据预测问题,提出时序数据的时间相关性可以作为一种经验知识,并根据时间相关性中的周期特性提出一种新的核函数构造方法,即时序核函数。所提出的时序核函数不仅可以实现时序数据时间相关性与支持向量机的融合,而且具有较好的泛化能力。(5)将时序核函数应用于环境时序预测建模,应用结果表明,与传统的核函数相比,时序核函数具有更强的预测能力。本文研究的内容是SVM研究中的热点问题之一,研究结果不仅具有重要的理论意义,而且对于实际问题具有直接的应用价值。