论文部分内容阅读
期货时间序列数据是按照时间顺序观察收集得到的买卖期货合约的价格数据,例如开盘价,收盘价,最高价等。期货时间序列的本质包括:大数据量,高维度、波动性小、不断更新。为了有效地挖掘历史期货时间序列中的隐含知识,学术界和产业界使用了各种技术来降低期货时间序列的复杂性,一种常用的方法是把期货时间序列转换成另一种容易理解的基于可视化重要点表述方法。同时,为了有助于克服期货时间序列数据的维数灾难,在表述方法基础上还需要提出一种相应的索引结构。本文针对如何表达期货时间序列的特征模式并能有效地完成给定特征模式的模型识别,研究了期货时间序列特征识别和索引方法,及期货时间序列的趋势模式识别应用。本文的主要研究工作和成果如下:(1)提出了基于Zigzag感知重要点的ZPIP(Zigzag based PerceptuallyImportant Points)重要点识别法。该方法是基于传统的PIP(Perceptually ImportantPoints)方法,并通过局部最大法和状态平衡法对局部重要点进行逐步优化,使其更能有效的识别期货时间序列重要点。(2)提出了基于二叉搜索树的FIS(Feature Index Structure)特征索引机制,以解决实时获得满足某种特征的期货时间序列的“慢”的问题。此方法基于二叉搜索树,为了更适合在线识别期货时间序列的特征,引入感知重要点概念及越后获得离根节点越近的原则,并获得良好的性能。(3)在以上研究基础上引入了期货趋势特征定义,提出了基于特征Zigzag的感知重要点的FZPIP(Feature Zigzag based Perceptually Important Points)特征识别方法,可以在期货时间序列进行特征识别过程中,通过差值法获得符合特征条件的候选时间序列,并通过相关实验验证了上述方法的良好性能。(4)研究了经典的期货时间序列分析函数-Zigzag函数,最终把基于感知重要点的ZPIP重要点识别法引入到此函数中,并通过相关的数据集的分析验证,表明了对于某种特征时间序列,基于ZPIP的Zigzag函数取得了更好的效果。(5)给出了基于感知重要点和K线的模式识别方法;在此基础上,实现了一种基于K线的期货时间序列模式识别原型系统,可有效地对特定K线趋势模型进行模式识别。