论文部分内容阅读
本文基于遍历论、粗粒化方法和信息论的思想研究了数据流非平稳性度量问题。并用提出的方法比较了不同数据流的非平稳性。
第二章介绍了数据流非平稳性度量的基本理论。基于粗粒化的方法对数据流的相空间做划分,通过判断数据流在相空间划分的集合上的频率序列的收敛性来提取数据流相空间的平稳信息结构。在保持其他条件相同的前提下通过比较平稳信息结构的精细程度来比较数据流的非平稳性。拥有较精细的平稳信息结构的数据流具有较小的非平稳程度。为了比较信息结构的精细程度,引入Shannon信息熵,并用数据流相空间平稳信息结构Shannon信息熵的上确界定义该数据流的非平稳性度量。有较高的非平稳程度的数据流的非平稳性度量值较小。
第三章介绍了数据流非平稳性度量的两个具体算法。其中一个算法是通过平均划分的方式提取数据流相空间的平稳信息结构,在这种算法中事先将相空间平均划分为N个小区间,并判断所有小区间对应的频率序列的收敛性,记录收敛的稳定区间并通过组合、合并非稳定区间的方式得到新的稳定区间,进而得到平稳信息结构。另一种算法是通过随机划分的方式提取平稳信息结构。在这种算法中通过产生随机点的办法产生划分,划分过程持续直到所有新的划分点都不能产生稳定区间。在本章中还提出了一种判别有限长序列收敛性的准则。
在第四章中用两种算法,在多种参数设置下计算并比较了了两组数据流的非平稳性。通过比较一组已知数据生成过程的平稳数据流和一组金融数据流的非平稳程度,验证了方法的有效性,发现:(1)该方法可以比较一类数据流的非平稳程度;(2)当数据流是非平稳时,用该方法也能找到数据流中部分平稳的信息。
最后在第五章中总结了全文,并提出了进一步研究和改进的可能方向。