论文部分内容阅读
本文基于“知识驱动的数据挖掘(Knowledge-driven datamining)",针对金融数据的特性对支持向量机进行适应性改进,并开展其在金融问题中的应用研究。首先,分析了支持向量机理论及其在金融数据挖掘应用方面存在的局限性。在概述支持向量机的涵义、模型构建原则、类型及其算法基础上,着重强调结构风险最小化原则是其内在本质和优势所在。但针对金融数据非线性、非平稳、高噪声等特性,常规支持向量机仍存在一些不足。如,对样本和特征的动态适应性较差,在处理具有野点、离群点等性质的金融数据时稳定性欠佳,等等。所有这些局限促成了本文工作的任务,即对支持向量机进行金融数据的适应性改进。其次,立足模型选择角度,围绕支持向量机的自身参数(meta-parameters)C、ε的确定和特征异质性的考虑,改进现有的样本重要性和特征重要性调整方法,探讨对样本和特征进行合理加权的途径,提高支持向量机对金融数据的适用程度。基于打折的最小二乘思想(DLS),利用基于信息特征与含量的概率估计方法,对指数权重函数进行修正,从而获得样本的权重值。同时,采用基于支持向量机输出对输入变量导数的显著性分析方法(DB-SA),获取输入向量特征的权重值,实现支持向量机对特征异质即特征相关性强弱的判断和赋值。而且,利用融合方法,尝试将样本加权和特征加权方法混合使用,建立一个合成的加权模型—混合加权支持向量机(HW-SVM),进一步提高支持向量机的稳定性和推广能力。再次,从外部融合视角,将支持向量机与其它机器学习方法和统计方法进行融合,实现不同方法之间的优势互补,更好地捕捉金融数据独特的内含信息。分别与copula函数和小波神经网络融合起来,构建混合的非线性系统,从外部改进支持向量机的性能,刻画金融市场的本质特性与特征变量,更好地分析金融市场不断演化的复杂机理。为检验支持向量机改进效果,在实例分析中主要涉及公司财务危机预测、期权和可转换债券定价、套期保值分析、金融市场联接形态结构与途径分析等方面的应用,均取得了良好的模型表现。