论文部分内容阅读
股票分类一直是金融和投资领域中重要的研究方向,并且是一项具有挑战性的任务。股票分类的关键是股票特征选择及分类模型的确定。近年来许多研究表明,成功的特征选择方法可以提高分类的准确性。那么,问题的关键是如何选择股票分类中具有代表性的特征。本文提出一种改进的混合式特征选择方法。这种新的两阶段特征选择方法结合了三种过滤式方法和改进的遗传算法(IGA),其中,IGA作为封装式方法,用于识别最优特征子集,从而提高分类的准确性和泛化能力。首先,使用三种不同的过滤式方法,实现特征的快速排序,并由此获得每个特征的权重。特征的权重作为重要的先验信息应用在改进的遗传算法中。在下一阶段,首先,先验信息用在遗传算法的初始种群设定上,从而加速种群的收敛;然后,改进交叉和变异算子,降低随机性造成的不利影响,引导搜索最佳特征子集,通过先验信息增加群体多样性;最后,引入多种群遗传算法(MPGA),可以同时结合三种过滤式特征选择方法的优势并做出鲁棒和准确的决策。本文选取从2009年至2013年在上海证券交易所交易的A股1108家公司的4173个真实历史数据,以股票年回报率的变化趋势为输出变量,选取七大类24个具有代表性的财务指标作为输入变量,实证本文提出的混合式特征选择方法的有效性。通过横纵向对比实验,比较分析了单种群改进遗传算法(SPIGA)和传统遗传算法(GA),GA、MPGA和本文提出的IGA。实验结果表明,IGA具有比过滤式方法和传统遗传算法更高的精度水平和更好的泛化能力。IGA可以成功选择出股票分类的重要特征,通过选出的特征重新对股票分类,结果表明,IGA是有效并且适用的特征选择工具,选择的特征是股票分类的良好指标。