论文部分内容阅读
时间序列预测(Time Series Prediction,TSP)作为一个热门的研究领域,其具有非常高的实际应用价值。作为机器学习中的一个研究分支,增量学习是比较擅长处理流数据的,而时间序列正是一种典型的会随时间而改变的流数据,所以增量学习非常适合用于解决时间序列预测的相关问题。本文主要提出了两种新型的增量学习算法用于处理时间序列预测问题。首先,本文将增量学习框架与增量式支持向量机(Incremental Support Vector Machine,ISVM)结合了起来,提出了一种新的用于解决时间序列预测问题的算法,即双增量学习(Double Incremental Learning,DIL)算法。ISVM是在支持向量机(Support Vector Machine,SVM)基础之上发展出来的,其比较适合用于处理时间序列预测这类在线连续学习问题。在DIL算法中,ISVM是被用作基学习器,而且DIL通过将现有基模型与在新数据上生成的基模型相结合的方式来实现增量学习。在DIL算法中提出了一种新颖的权重更新规则,用于在每次迭代过程中更新样本的权重。此外,DIL采用了一种经典的方法来集成所有基模型。DIL算法继承了ISVM和增量学习的诸多优点,所以其对时间序列进行预测时能够取得较为理想的预测效果。在六个基准时间序列数据集上的实验结果也证实了,与其他现存的优秀算法相比,DIL具有更好的预测性能。针对DIL算法中的不足,本文做出了一些改进,并将改进后的算法称为双权重优化增量学习(dual weights optimization Incremental Learning,w~2IL)算法。w~2IL采用的基学习器是增量式极限学习机(Incremental Extreme Learning Machine,IELM)。相对于DIL算法,w~2IL的改进主要有两处,这也是它的两个主要创新点,即提出了样本权重自适应初始化(Adaptive Samples Weights Initialization,AdaSWI)和自适应加权预测器集成(Adaptively Weighted Predictors Aggregation,AdaWPA)两个子算法。AdaSWI子算法根据已生成的基模型的预测误差自适应地初始化样本权重,并根据从样本到基模型训练集的距离对样本的权重进行微调,从而获得更合适的初始化权重。而AdaWPA算法基于待预测的实例自适应地调整所有基模型的权重并将它们集成。此外,AdaWPA在进行距离测量时使用到了模糊C均值(Fuzzy C-Means,FCM)聚类算法,这进一步降低了算法的计算复杂度和所需的存储空间。相比于DIL算法和其它现存的算法,w~2IL的性能得到了显著提升,在六个真实数据集上的实验也进一步验证了这一点。