论文部分内容阅读
从A股市场诞生至今,A股经历了数次大幅的上涨和下跌,这些非理性的大幅涨跌很难完全用传统金融理论做出解释,而行为金融理论正是从投资者情绪的角度出发对各类金融异象与非理性行为现象做出了解释,投资者情绪在股票市场的非理性繁荣和恐慌式下跌中无疑起到了推波助澜的作用。本文以上述现象作为切入点,研究了市场投资者情绪对市场指数收益及异质性上市公司股票收益的影响效应,并使用数据挖掘模型对收集到的数据进行建模。首先选取投资者A股账户新增开户数(NIA)、换手率(TURN)、消费者信心指数(CCI)、成交量(VOL)、中国证券投资者信心指数—买入指数(BII)等五个指标作为投资者情绪的代理指标,通过第一次主成分分析消除提前滞后效应的影响,通过第二次主成分分析消除宏观经济变量的相关性,并通过回归剔除宏观经济变动对投资者情绪的影响效应,再通过偏最小二乘回归方法提取与真实投资者情绪相关的部分得到最终的投资者情绪综合指标。其次,通过随机森林算法,从一系列具有代表性的候选技术指标中选取重要性高的技术指标作为数据挖掘模型的输入变量,即BBI多空指数、BBIBOLL多空、BIAS乖离率、BOLL布林带、RSI相对强弱指标五个指标。然后,将投资者情绪综合指标及筛选后的技术指标作为模型的输入变量,训练并建立BP神经网络模型。最后,通过分析纯技术分析指标,以及加入去噪后投资者情绪综合指标建立的神经网络模型预测股票价格的准确率的区别,研究了投资者情绪指数在股票预测建模中的影响,并按规模性指标和成长性指标等公司特征变量对公司进行交叉分类,研究什么类型的股票更容易易受到投资者情绪的影响。经过上述的研究步骤,本文主要得出了如下的结论:以纯技术指标建模的神经网络模型预测值与股票价格实际值的平均绝对误差为MAD=19.6854。将去噪后的投资者情绪指标以及筛选后的技术指标作为输入变量建立的BP神经网络,其预测值与股票价格实际值的平均绝对误差为MAD=9.823。结论表明与单纯使用技术指标建模的BP神经网络相比,加入了投资者情绪变量的数据挖掘模型在预测股票价格的准确性方面表现更好,在拟合A股市场走势时具有更大的优势。在对公司按规模性指标和成长性指标等特征变量进行交叉分类的研究中,神经网络模型预测值与股票价格实际值的偏差程度最小的股票类型为小市值价值型股票组合(MAD=7.173),拟合效果最好,而神经网络模型预测值与股票价格实际值的偏差程度最大的股票类型为大市值成长型股票组合(MAD=23.703),拟合效果最差,而小市值成长型股票组合与大市值价值型股票组合的拟合效果介于上述两种特征组合股票类型之间。