论文部分内容阅读
随着信息技术的发展,人们生产和收集数据的能力大幅度提高,与之相对应的是数据分析和知识获取能力上的相对滞后。从数据收集、数据库的创建、数据管理,到高级的数据分析技术,数据挖掘(Data Mining)技术随之产生和发展。数据挖掘是从数据集或者数据库中识别出有效地、新颖的、有用的、可理解的模式的非平凡过程。分类挖掘是数据挖掘的重要应用之一,分类能力是通过构造一个分类器来实现,其构造方法有统计方法、机器学习方法、人工神经网络方法等。人工神经网络(ANN)是数据挖掘的重要方法之一,通过模拟人脑生物神经网络,将若干具有处理功能的神经元节点按照一定的结构连接起来,使其具有处理模糊、不精确数据和复杂非线性映射问题的能力。神经网络所能识别的模式是由网络的拓扑结构、连接权值和节点阈值决定的。因此,针对神经网络模型的优化方法主要分为优化网络的拓扑结构和优化网络的权值阈值。本文重点研究基于BP神经网络的分类器模型,以及BP神经网络模型与其他优化算法的结合,包括遗传算法(GA)、粒子群算法(PSO)、Adaboost算法。GA和PSO具有全局搜索的性能,多用于优化网络的权值阈值和隐含层节点数。Adaboost算法是基于集成的思想来建立一个加强型的分类器。与标准的BP分类模型相比,优化后的分类器能够明显提高分类精度,减少错判率。进一步研究了Adaboost算法,针对分类中的两类错误FNR和FPR,本文引入了基于重视程度的样本自适应权重算法,用来改对善重视程度高类别的判别能力。本文的实证分析是将基于BP神经网络构建的分类器模型应用到财务分析领域,建立上市公司财务危机预警模型。通过数据准备阶段、分类器建模阶段、挖掘阶段、解释分析阶段,把数据挖掘方法应用财务预警系统中,构建了一个适用于财务预警的分类器,并通过单一BP分类器、Adaboost_BP分类器和改进的Adaboost_BP分类器的测试样本分类结果的对比,验证了Adaboost算法和改进算法的有效性。