论文部分内容阅读
数据预测在金融投资领域占有重要地位,而股票价格由于具有变化幅度大,变化因素多,变化不稳定等特性,因而成为金融数据中最复杂最难预测的数据类型之一。正因为这些因素的原因,其神秘性也引起了广大经济学家的兴趣,很多经济学家一直致力于研究股票市场价格的变化,希望能从中找出一些规律,避免诸如大的股市波动,从而保持经济繁荣稳定。时间序列分析是数据挖掘和应用统计学中的一类典型问题,而基因表达式程序设计是一种新的自适应演化算法,该算法已经应用到许多领域中,并且取得了很好的效果。但是由于其具有“容易早熟收敛,陷入局部最优解”的缺陷,因此引入模拟退火的思想将二者融合,设计GEPSAT-STOCK算法用于股票指数建立时间序列模型,并且针对股票数据的特点,选择适应股票规律的GEPSAT-STOCK模型,包括GSAT-G编码模型,适应度值函数选择以及GSAT-CT求解适应度值算法等。研究了三个新的算子---保存算子、替换算子,自适应算子,用VC的多线程技术做成可视化界面动态显示其结果,使用000002(万科A)号股票(2007年第一个交易日至2008年5月12日)每天的股票收盘价格作为实验数据,与传统GEP算法得到的数据结果进行对比分析,以此来分析GEPSAT-STOCK算法在该问题应用上的优劣。结果显示,利用GEPSAT-STOCK算法进行预测取得了较好的结果,其预测精度较高,以4d作为嵌入维进行预测时的平均相对误差在1.4%左右。然而虽然股票的预测平均误差很小,但是要想精确预测股票价格还是不太可能,因为影响其变化的因素很多,但并不意味着股票时间序列的预测就变得没有任何意义。虽然股票数据的结果不能精确预测,但是可以估计出大致范围,从而为预测股票的走势提供了有利条件。而预测出的股票的走势可以为股票的交易提供一种可靠的理论保证,这样就可以降低金融风险,减少股票交易中资金的损失。通过实验验证,算法在以4d为嵌入维预测时,通过不断优化可以使升降判断的准确率达到85%以上。