论文部分内容阅读
随着全球互联网经济的迅速发展,互联网金融、网络购物、网上银行等电子商务的发展势头迅猛。尤其是中国经济蓬勃增长的今天,银行客户服务环节正经历着严峻的挑战。由于外资银行抢先一步收到网络革命的洗礼,在进入中国市场之后,在电子化、网络化银行方面比中国银行显示出更为优秀的潜质。拥有全球相当大市场份额的中国互联网金融市场,面对外资银行的冲击,面临严峻的挑战。另一方面,计算机相关技术的迅猛发展,使得数据仓库(DW)、数据挖掘(DM)等数据分析类技术日趋成熟。同时,面对我国金融领域进一步面向全球开放,银行业内的竞争趋势日显突出,而在此竞争过程中,信息化成熟度的影响尤为重要。银行业中,信息化的过程分为业务信息化阶段、大数据集中阶段和数据处理阶段。据今年各大银行年报分析,大多数银行现已完成大数据集中阶段。从客户层面考虑,银行为了更好的向客户提供服务,自然地选择了数据仓库及数据挖掘技术做为数据处理以及之后服务客户的技术支撑平台。对于目前大部分银行的业务,现已可以完成数据仓库高效地记录、统计、更改、查询客户数据环节。然而,为了深层次地挖掘客户信息,更好的向客户提供服务,目前各银行无法挖掘分析出数据中存在的关系,以及各客户数据属性贱的规则,更无法根据现有的客户数据进行分类分析,以致无法准确判断客户的消费需求。本文依托互联网金融的大环境,针对银行业中存在的大数据无法深度挖掘的现状,首先在数据仓库ETL整体流程中的数据转换模块,对进行处理后的源数据进行优化,提出了更优的KNN*算法,在进行数据挖掘的步骤前对数据进行了进一步的整理与筛选。接下来提出了银行数据在数据挖掘方面算法优化的观点,利用双重优化的Pro—Apriori决策树算法,对数据进行分类挖掘之后再进行预测判断,从而更便捷的处理银行业大数据中知识获取的难题。论文对我国银行领域实施部署行业级数据仓库、结构化数据挖掘技术、金融产品规划、完善客户分类、市场需求动态分析、加强客户关系管理、市场销售分析等各个方面有一定的指导性建议和借鉴意义。