论文部分内容阅读
股市定价模型主要用于对个股和组合的收益率进行分析预测。目前,传统的股市定价模型主要为统计学和计量经济学模型,其都存在不足:第一,为单一尺度模型,即只能进行某一时域的判断,忽略了股市波动性大、数据变化频繁的特性,无法同时得出多个时期收益率的预测结果;第二,其通常来源于西方成熟的股市,模型因子一般为固定的2-3个指标,而A股中影响收益率的因子达上百个;第三,其用于A股的分析时,对某些组合的解释效力不佳,即调整后的方差值不显著;第四,其因子的提取非常复杂,完成Fama-French三因素模型因子的计算需要使用70多张223*256规格的Excel表。本文结合三种数据挖掘技术,对传统股市定价模型——Fama-French三因素模型进行改进和扩展。首先,构造基于Daubechies小波的多尺度Fama-French三因素模型,实验结果表明:加入Daubechies小波多尺度分解方法,能同时观察多个时域三因子对股票收益率的影响,解决了传统模型只能用于单一时域的弊端。其次,将聚类技术用于横截面因子挖掘。本文提出了层次分割聚类算法,其结合了层次聚类BIRCH算法和分割聚类CLARA算法,用以避免BIRCH方法对非球面和孤立点数据失效、以及CLARA方法的分类值仅靠用户人为判断难以确定的缺陷。同时,改进后的聚类算法可以进行大规模、非球面数据集的聚类分析。再次,构造基于改进的聚类算法和BP神经网络的多因素预测模型。其通过用聚类后的四个因子构造神经网络模型而实现,最终预测出六个股票组合在多个时域的收益率大小,并与真实值进行比对。实验表明,其解决了传统Fama-French三因素模型中B/H组合的调整后方差不显著的问题。最后,将基于改进的聚类算法和BP神经网络的预测模型用于选股。实验结果表明,聚类出的12支股票组合的收益率预测值和真实值拟合效果较好,同时其降低了传统模型中因子计算的复杂度,节约了投资者进行股市定价分析的时间。