论文部分内容阅读
股票市场作为市场经济的“晴雨表”反映着我国经济的总体状况,在我国经济发展中起着重要的作用。随着股票市场的发展,越来越多的人选择投资股票。为了可以准确的选择优秀的上市公司进行投资,从中获取可观的收益,这就需要对股票市场上不同的上市公司的综合经营绩效进行准确的分析预测。然而股票市场数据量庞大,是一个非常复杂的系统,利用传统的方法很难对它做出准确的预测。数据挖掘技术是一个从海量的杂乱无章的数据中提取出隐含和潜在的对决策有价值的信息和模式的过程,它可以处理股票市场上规模巨大、繁琐、杂乱无章的数据。本文利用数据挖掘技术中的C5.0决策树、BP神经网络和RBF神经网络三种分类算法以上市公司的综合经营绩效等级为分类标准进行分类预测。本文选取2012年A股市场上200个上市公司为样本,其中50个为A股市场上综合绩效最优的股票,50个为综合绩效最差的股票,另外100个为随机选取的综合绩效一般的股票,其中50个为上证股票,50个为深证股票。以股票的综合绩效等级为输出变量,选取七大类14个有代表性的财务指标作为输入变量,运用SPSS Clementine软件,利用C5.0决策树、BP神经网络和RBF神经网络三种分类算法分别建立分类预测模型。在建立模型时,随机选取样本集中80%的数据作为训练样本,用于模型的建立;选取样本集中其余20%的数据作为测试样本,用于模型有效性的检测。模型建立之后,对三种分类方法的预测准确率进行比较可知, C5.0决策树算法得到的对测试样本集的预测准确率最高,运用C5.0决策树更具有参考意义。由三种分类方法给出的重要变量可知,每股收益增长率对上市公司的综合经营绩效影响最大,现金流动负债比和流动比率对上市公司的综合经营绩效影响也较大。利用三种分类预测模型对上市公司的综合经营绩效进行分析,找出优秀的上市公司财务指标所共有的特征,为投资者在股票的投资决策上提供帮助。