论文部分内容阅读
股票价格的波动起伏是扑朔迷离和令人激动的,股票价格的未来走向也是所有股票市场的投资者们最为关心的问题。本论文欲采用数据挖掘中的决策树方法,利用众多技术指标的历史数据作为训练和检验样本,达到对我国股票市场价格走向作较准确预测的目的,进而对我国的股票市场的效率问题作一分析。 论文首先对技术分析起源及应用的条件做了简单介绍,而后阐述了技术分析的应用的两种方式:一种是技术分析的图标表示形式,在其中还介绍了几种技术分析理论,如道氏理论,艾略特波浪理论等。另一种是技术分析的量化表示形式,如移动平均线(MA),相对强度指标(RSI)等。 决策树学习是应用最广的归纳推理算法之一,是一种逼近离散值目标函数的方法,在这种方法中学习到的函数被表示为一棵决策树。在本论文中,从技术分析的量化指标体系中按市场趋势指标,市场动量指标和市场人气指标三个方面选出七个较知名或常用的技术分析指标的历史数据作为决策树方法实施的样本数据。论文中决策树方法的实施具体做法是: 首先,从我国股票市场中选出总股本最大的前二十支个股,在从这二十支股票中选出累计换手率最高的前八支股票。 其次,搜集到这八支股票的七个技术分析指标的历史数据,论文中又按数据的日间隔和五分钟间隔的不同分别搜集两组这八支股票的历史数据。 再次,把每组中每支股票的历史数据按时间先后顺序分成两部分。论文中在两组数据中的各个股票均搜集416笔数据,以每支股票的技术分析指标的前336笔数据和相应的隔日或(隔五分钟)涨跌的数据作为建立决策树的训练样本,而以后80笔数据作为检验数据来检验决策树分类效果如何,后80笔数据是如何实现检验的呢?具体检验的做法是通过后面80笔的各个技术分析指标的数据依据前面建立的决策树来预测隔日(或隔五分钟)的股票价格是涨还是跌,然后把预测出的涨跌情况与实际历史资料中的涨跌情况对比来计算预测准确率。 在以日线数据为样本的一组中,从八支个股中,随机抽出四支个股来建立决策树,也就是分别以抽出的四支个股的前336笔数据来建立四棵决策树,而检验各个决策树的预测效果时,是以抽出的四支个股的后80笔数据全部分别应用到建立的四棵决策树上,来分别计算这四棵决策树的平均预测准确率。然后挑出预测准确率高的前两棵决策树,来作为预测剩余未建立决策树的四支股票的涨跌情况。进而计算出这两棵决策树对剩余四支股票价格涨跌的预测准确率。 在以五分钟线为样本的一组中,也做同日线数据组中同样的工作,算出建立的效率较高的两棵决策树对剩余四支股票的价格涨跌的预测准确率。 论文中通过以上建立决策树的过程,可以得知,在日线数据建立的预测效率较高的两棵决策树分别是以股票代码为600350和600871的股票数据来建立的决策树,这两棵决策树的预测平均准确率分别为48.42%和55.06%。而在五分钟线数据建立的预测效率较高的两棵决策树分别是以股票代码为600026和600871的股票数据来建立的决策树,这两棵决策树的预测平均准确率分别为55.38%和60.76%。 由以上的结果可知使用五分钟线数据来建立决策树比使用日线数据效果要好,以股票代码为600871的个股建立的决策树做预测准确率最高。而通过决策树预测准确率与随机猜测的(准确率为50%)的比较,可得决策树预测比随机猜测的准确率显著要高。而假设对预测股票价格的涨跌有较好的效果,也就说明量化的技术分析方法在我国股票市场上可以获得超额利润,因此根据本论文的结果,我国股票市场还不具备弱式效率市场的条件。 最后根据决策树分类的树状图,可以看出技术分析指标中,两个最重要的因素是六日的BIAS即BIAS6和五日的移动平均线即MA5。建议投资人可以单独将这两个指标抓出来观察,进一步跟踪和预测股价的变化。