论文部分内容阅读
集成选择技术可以有效地解决集成学习存在的高时间复杂度和空间复杂度的缺点。然而每个预测器都有自己独特的能力,某一个预测器可能在一些样本上表现的不够好,但是在其他样本上可能会有非常优异的表现,所以盲目地低估或者否认一个预测器的能力是非常不合理的。因此,为每一个测试样本选出最佳的预测器集合正是动态集成选择技术所要实现的工作。同时动态集成选择技术被证明适用于解决时间序列预测问题。本文提出了六种可以应用于时间序列预测的动态集成选择算法,分别是DES-PALR、DES-CP-Var、DES-CP-Clustering、DVS-PvOv、DVS-NsAs以及DVS-OpOp。DES-PALR算法是基于预测器在测试样本的局部区域的预测精度来实现动态集成选择技术;DES-CP-Clustering算法和DES-CP-Var算法是基于预测器对测试样本的预测一致性程度来实现动态集成选择算法,它们的一致性程度分别由聚类算法、预测值方差计算而来;DVS-PvOv算法是基于测试样本的预测值与训练样本的目标值之间的相似性来动态选取验证集实现动态集成选择算法;DVS-NsAs算法是基于新构造的样本与训练样本之间的相似性来动态选取验证集实现动态集成选择算法;DVS-OpOp算法是基于测试样本的输出文件与训练样本的输出文件之间的相似性来动态选取验证集实现动态集成选择算法。动态集成选择算法是从预测器集成池中选择最有竞争力的预测器参与对测试样本的决策,选择预测器的前提需要定义一个标准来衡量预测器的性能。但是只使用一个标准不足以充分衡量一个预测器的全部特性。本文提出了将一个基于元学习的动态集成选择算法(META-DES-TSP)应用到时间序列预测问题上,初始集成系统由极限学习机与层次式极限学习机构成。基于四种不同的衡量标准,提出四种用于训练元预测器的元特征集合,使用元预测器判决初始集成系统中基模型的去留。此外,针对不同的时间序列数据集,元特征集合的大小由遗传算法动态调整。尽管极限学习机与层次式极限学习机已经具有比较优越算法性能,但是这两个算法仍然无法自动确定合适的隐节点个数。本文提出了ELM-SO和H-ELM-SO模型,这两者不仅保留了各自原模型的自身的优点,而且可以自动剪枝各隐藏层合适的隐节点以获得优异的表现。