论文部分内容阅读
随着我国经济的迅猛发展,股票收益预测研究不断涌现。尤其是伴随经济的进步和技术的飞速发展,越来越多的公司和大型数据库以电子数据的方式向公众提供海量的信息,再加上数据挖掘技术的引入,各种研究方法推陈出新,最终导致了伪回归现象的加剧。因此,针对解释变量的高持久性和预测回归的大量噪声,研究股票收益预测过程中的伪回归现象显得尤为重要。 本文通过理论研究和蒙特卡罗模拟控制数据的信息、噪声、容量来研究哪些因素、信息及噪声含量会对股票收益预测造成影响,并最终产生伪回归现象。首先,借助蒙特卡罗渐进逼近模拟收益序列和解释变量数据,其次,运用回归预测和自回归分析得到常用统计量,然后,运用信号、噪声、样本容量、持久性、相关性相结合的方法研究各统计量的渐进分布及回归模型的预测性能。最后,选取上证指数收益以及深证指数收益作为研究样本,结合模拟结果共同分析股票收益中的伪回归现象。 研究发现,增加观测数据并不会使数据中的信号伴随样本数据数量以相同的比率增加,反而增加了更多的噪声而非信息。另外,增加数据观测量易使数据因拥有趋势而产生伪回归现象。总体来看,当信号、噪声、样本容量达到一定的比值时,显示t检验的可信度小,回归拟合程度低,斜率系数存在伪回归现象。本文还分析了上证指数收益序列中的伪回归现象,并对比了上证和深证指数收益中含有趋势程度高的序列伪回归预测现象,发现单方面参考?统计量判断伪回归是不充足的,此时需要结合信号与噪声比、回归残差与解释变量自回归残差的相关系数、股票收益的持久性、解释变量的持久性等因素综合考虑。另一方面,对于含有低趋势程度回归的股票收益和预测变量,可以简单的参考参数?和信号与噪声比?统计量来判断伪回归现象,其他统计量作为辅助参考因素有助于找出经济变量之间的真实关系。