论文部分内容阅读
知识发现是近年来人工智能和数据库领域研究的前沿课题。面对市场竞争的加剧和信息技术的发展,银行必须建立“以客户为中心”的管理模式。因此利用知识发现技术对海量的银行零售客户数据进行挖掘分析,从中发现各种潜在的、有价值的、规律性知识具有重要的理论意义和应用价值,也是当前金融信息知识化的重要前沿课题。本文运用理论分析与实证研究相结合的方法,针对银行零售客户数据KDD的相关问题进行研究,主要内容如下:
1.系统地分析和设计了商业银行零售客户数据仓库系统,对系统中的某些关键技术提出了新颖的解决方案,如多源零售客户信息整合技术、基于事件触发的数据仓库主动更新策略等,并对银行零售客户数据仓库及其OLAP分析系统的实现进行了详细研究。
2.然后建立了基于SOM+GA+k-means的两阶段聚类模型,并利用模拟数据进行了实证分析;借鉴数据库营销技术的RFM分析模型,设计了银行零售客户消费行为分析的LRFM模型和还款行为的“RFM”模型,建立并实证分析了基于SOM+GA+k-means的消费和还款聚类分群模型;在此基础上,结合零售客户人口统计数据、账户数据、交易数据,建立基于零售客户行为的关联知识发现模型并进行了实证分析。
3.最后建立了基于SVM&DT的多分类器融合模型和基于k-means聚类的MA类别数据分割技术,并利用UCI的Breastcancer数据集对模型进了实验研究;然后针对银行零售客户信用分类数据中类别分布不对称(如违约和正常客户)问题和多分类器融合的优点,建立基于SVM&DT结合基于k-means聚类的MA类别数据分割技术的银行零售客户信用分类模型并对模型进行了实证分析。
通过本文的研究,为银行零售客户数据的知识化建立集成分析环境和应用知识发现技术进行零售客户数据分析的理论研究和工程实践提供了参考。