论文部分内容阅读
数据挖掘(Data Mining,DM)是指从数据中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术,被广泛应用于银行金融、保险、政府、教育、运输等企事业单位及国防科研上。数据挖掘应用的普遍性及带来的巨大经济和社会效益,吸引了许多专家和研究机构从事该领域的研究。本文阐述了数据挖掘技术在国内外的研究现状,对目前主要的数据挖掘算法如聚类分析、分类分析、相关分析和统计分析进行了剖析,对当前最为流行的数据挖掘工具IBM Intelligent Miner、SPSS Clementine及SAS Enterprise Miner进行比较分析,阐述了数据挖掘技术的未来发展趋势。随着银行数据越来越丰富,大量的数据被描述成“数据丰富,但信息缺乏”。结果,收集在大型数据库中的数据变成了“数据坟墓”一难得访问的数据文件。这样,使得银行很多重要的决定不是基于数据库信息丰富的数据,而是基于决策者的直觉,因为银行决策者缺乏从海量数据提取有价值信息的工具。而通过数据挖掘工具进行数据分析,可以发现重要的数据模式,将银行的数据坟墓转换为知识“金块”。应用数据挖掘技术对我国金融机构有重要意义。国外银行业成功应用数据挖掘技术的例子有很多,如美国Firstar银行、Bank one银行,爱尔兰的AIB银行。国内银行在这方面应用得还不多。论文以某银行个人信贷系统的开发为背景,将数据挖掘技术应用于银行领域。论文做了大量的研究工作,如数据的获得、数据转换、数据整合及数据清理,从数据源上保证数据的正确性、一致性、完整性和可靠性。文章对个人信贷客户进行了性别、年龄的统计分析和聚类分析,掌握个人信贷客户的年龄分布情况;对个人贷款进行分析,同时对不良个人贷款数据进行了数据挖掘工作,所获得的信息有益于风险管理与控制,有利于银行业务的发展,对银行高层进行决策提供了科学的依据。最后,论文对存在的问题进行了分析,并对后续工作进行了展望。