论文部分内容阅读
时间序列的不确定性和预测的研究越来越被各学科领域的研究学者们所关注,各类分析研究方法也被广泛地运用到了医学、物理学、经济学以及生物科学等学科领域。本文提出了两种对于时间序列不确定性研究的度量方法,以及一种对时间序列的预测方法,并以金融时间序列作为研究对象。首先,本文基于置换模式的Havrda-Charvat熵,为挖掘相同置换模式下的不同振幅,提出了一种新的熵方法—加权Havrda-Charvat熵。为分析该方法的实用性,我们研究了七组时间序列,包含一个逻辑映射作为模拟数据,中美各三种股票数据作为金融数据,分别为中国的上证指数、深圳成指、沪深300指数,以及美国的标准普尔500指数、纳斯达克指数和道琼斯工业指数。通过比较不同嵌入维度、粗粒化程度以及权重在时间序列上的影响,我们可以分析出熵值随着粗粒化程度的增大而减小,并趋于稳定。而对于嵌入维度,熵值在嵌入维度较高时差异明显,更有利于我们分析时间序列的不确定性变化。此外,加权Havrda-Charvat熵虽然与Havrda-Charvat熵在趋势上保持了相似性,但在数值上始终低于Havrda-Charvat熵,且在小范围存在波动。在权重的作用下,Havrda-Charvat熵的熵值有所下降,表明时间序列的不确定性有所降低,也说明了权重对时间序列不确定性的度量有着良好的作用。其次,本文通过分析置换熵和分布熵在模拟数据上的应用,发现两种熵方法在不同时间序列上表现有优有劣,因此,我们提出了以置换熵和分布熵为基础的二维熵平面,以使两种熵方法达到互补的作用,从而能适用于多种时间序列。同时,鉴于Havrda-Charvat熵在金融时间序列上已有的良好表现,我们提出了置换HavrdaCharvat熵-分布Havrda-Charvat熵形成的二维熵平面。首先我们在模拟数据—逻辑映射上验证置换Havrda-Charvat熵-分布Havrda-Charvat熵形成的二维熵平面的可行性之后,我们再通过在亚美欧三洲的股票数据上的实验分析,其中股票数据分别为:亚洲的上证指数、香港恒生指数、日经225指数;美洲的道琼斯工业指数、纳斯达克指数、标准普尔500指数;以及欧洲的荷兰AEX综合指数、法国CAC40指数、西班牙IBEX指数,我们可以发现美洲股票数据相对比较集中,易于区分。亚洲的日本股票数据,相较于中国,更接近欧美的股票指数。而欧洲的股票数据相对来说比较分散,且在熵平面上与各国经济差异相匹配。由此说明,置换HavrdaCharvat熵-分布Havrda-Charvat熵形成的熵平面可以较好的刻画时间序列的相似性、随机性以及不确定性。最后,本文还提出了一种广义k最近邻—具有不变性的时间序列预测方法。为解决k最近邻存在的三个问题:幅度和偏移的不变性、复杂度不变性和碎片匹配,我们提出了归一化和复杂度不变距离。同时,为了使k最近邻适用于多种时间序列,我们将复杂度不变距离进行推广,提出了广义k最近邻—具有不变性的时间序列预测方法。通过在ARFIMA模型上的模拟实验,验证了将预测方法推广后能更有效提高预测的精准度。之后,以上证指数和纳斯达克指数作为参考,选取广义k最近邻—具有不变性的时间序列预测方法最佳指数,同时在另外七种亚美欧三洲股票数据—香港恒生指数、日经225指数、道琼斯工业指数、标准普尔500指数、荷兰AEX综合指数、法国CAC40指数和西班牙IBEX指数上加以实验,验证了广义k最近邻—具有不变性的时间序列预测方法在金融时间序列的预测上有着实际应用价值。