论文部分内容阅读
时间序列(以下简称“时序”)分析与预测是数据挖掘与管理科学领域最为重要的研究方向之一。把握各主要变量在时间维度上的波动特征与趋势规律,是深入理解相关研究领域的系统机制与发展动态的基础,它能为信息处理、决策分析与政策制定提供强有力的理论依据与方法支持。作为学术界的研究热点,如何提高预测性能及其准确性是时序研究领域最重要的难题之一。现有大部分研究均与提高预测精度相关,用不同的方法来改进和提高时序数据的预测性能指标。然而,不同的预测模型具有各自的数据针对性与优劣势,现有文献不足以证明某一种方法在各种数据样本中具有最高的预测精度与准确性。这意味着时序预测研究需要较大的理论与方法创新,充分考虑研究样本的数据特征在预测中的重要性,构建具有广泛适用性及较高预测性能的预测方法。
在此背景下,本文紧扣研究样本的数据特征,以分解思想为核心,提出了一个新的时序预测方法论——数据特征驱动分解集成方法论,试图提高模型的分析与预测性能。具体的,新方法论将“数据特征驱动建模”与“先分解后集成”思想相结合:“数据特征驱动建模”思想可定义为,一个有效的预测模型必须与样本的各种数据特征相匹配,并准确刻画其主要特征;相反,忽略数据特征而构建不恰当的数学模型,预测将会失效;“先分解后集成”思想,即“分而治之”思想,意在将复杂系统分解为—系列易于描述的简单子系统,以降低建模的困难性,提高系统分析研究的可行性与有效性。本文主要的创新可概括为以下几个方面:
(1)提出了一套新的时序预测方法论
基于现有时序预测研究,本文将“数据特征驱动建模”与“先分解后集成”思想相结合,提出了一套新的时序预测方法论,即数据特征驱动分解集成方法论。该方法论以分解集成模型为框架,包括时序分解、模态预测与集成预测等3个主要步骤,并紧扣研究样本的数据特征,构建相应的分技术。该方法论具有广泛的适用性,可显著提高模型分析与预测性能,为时序预测提供一个新的研究思路。
(2)构建了一套综合性的时序数据特征识别方案
本文对时序数据可能具有的数据特征及其相互关系进行了系统梳理,并对相关特征检验方法进行了全面分析,在此基础上构建了一套综合性的数据特征识别方案。该方案能更系统、全面地把握时序数据的本质特征与主要模式特征,为新方法论构建各种分技术(时序分解、模态预测与集成预测技术)提供方法基础。
(3)提出了数据特征驱动的时序分解方法
本文将“数据特征驱动建模”思想引入新方法论的第1步,根据研究样本的数据特征选择不同的分解方法。通过对现有3种主流分解方法(时域分解方法、时频分解方法与瞬频分解方法)的数据针对性进行深入系统的分析,本文针对样本不同的数据特征,提出了与其相匹配的分解方法。基于数据特征的时序分解方法,确保了新方法论中时序分解的有效性,提高了模型的预测精度与准确性。
(4)提出了数据特征驱动的模态预测方法
基于“数据特征驱动建模”思想,新方法论在第2步中,通过识别各模态分量的数据特征,包括本质特征与模式特征,以确定模态预测方法的类别与形式。充分考虑了各模态分量的本质特征,并选择相适应的预测方法的分解集成模型,能显著提高各模态分量的预测精度。进一步考虑各模态分量的模式特征,并引入主要模式特征变量的分解集成模型,可进一步提高最终预测效果。
(5)提出了数据特征驱动的集成预测方法
基于“数据特征驱动建模”思想,完成新方法论的第3步,即根据原始时序数据的本质特征,选择与之相符的集成预测方法,对分预测结果进行有效集成。本文对现有主流的集成方法的数据针对性进行了分析,包括简单集成、传统计量集成与人工智能集成。在此基础上,提出了数据特征驱动的集成预测方法,确定了集成方法与不同数据特征的匹配性。该方法能有效识别原动力系统内部错综复杂关系,进而提高时序数据的预测精度。