论文部分内容阅读
企业财务危机预测是非线性预测,各个影响因素之间又存在着复杂的组合决策关系,并且现实中的数据多为连续的,很难直接用于机器分类学习。企业财务危机预警问题本身的特点和复杂性,使其很难用传统的统计分析方法进行建模。因此本文从分析财务预警问题的特点出发,融合了智能软计算的多种方法建立了完整的预测模型。总体过程如下:首先以粗糙集决策表一致性水平、区间平均信息熵、离散化程度等因素作为离散化结果的评价标准。然后利用遗传算法全局、并行搜索的优点,以上面提到的3个因素作为启发信息对所有条件属性的割点集合进行最优搜索。得到了离散化的数据后,用BP神经网络对数据进行分类学习。最终网络学习训练完毕后即可以对企业财务状况进行预测。 论文主要工作: 1.改进了粗糙集一致性水平的计算模型。粗糙集一致性水平的标准计算模型,计算量大。尤其在用遗传算法进行最优割点搜索时,每一次遗传进化迭代,都必须为种群中的每一个体计算其编码所代表的一致性水平,这样大大影响遗传算法的执行效率。本文采用先构造“粗糙集割点矩阵”的方法,用剖点集合所能区分异类元组对的个数来描述决策表一致性水平的高低。同时又采用了时间换空间的策略,为决策表每一个条件属性建立索引视图,这样可以减少一次排序操作,降低算法时间复杂度O(n·logn)。由于视图只是元数据表的逻辑索引,也并不造成很大的空间浪费。 2.提出了基于粗糙集一致性和信息熵的遗传方法的离散化算法(LEGAD)。该离散化算法考虑了全面的启发式信息,即同时考虑了决策表的一致性水平、离散化后区间的平均信息熵、条件属性离散化程度这3个影响离散化结果的重要因素。这样可以最大程度的保证属性离散化后,决策表的一致性不被破坏,保持决策表的相容性,并且白于考虑了信息熵,决策表的类别混乱程度低,分类能力就变强。一个好的离散化算法,能够对以后机器学习算法的执行效率和分类结果产生非常积极的影响。 3.用VC维来辅助决定神经网络结构。VC维是统计学习理论中的一个核心概念,它是目前为止对函数集学习性能的最好描述,神经网络的VC维与拓扑结构之间有着必然的联系。BP网络隐藏层神经元数目一般都是通过经验值给定的,缺乏可靠的理论依据。本文用单隐藏层BP神经网络的VC维、以及误差上限、训练集的规模来估算BP神经网络隐藏层神经元的个数。 4.用C#.Net、SqlServer2000、XML技术构建了《上市公司财务预警分析系统》。实现了遗传算法工具箱,提供给用户友好的UI界面,可以自由输入各种遗传算法初始参数,如迭代进化次数、交叉概率、变异概率、最优保留个体数目等。实现了BP神经网络工具箱,并对标准BP算法进行了改进,加入了动量因子、批量训练、可变学习速率等优化方法。系统提供了友好的UI界面,用户可以自由选择各种参数,如隐藏层神经元个数、批量或串行训练方式、动量因子选择、误差允许的阈