基于机器学习的某商业银行客户画像模型研究

来源 :重庆理工大学 | 被引量 : 1次 | 上传用户:jy02324491
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
客户是商业银行利益的根本。面对日趋激烈的行业竞争与饱和的市场环境,如何有效的利用客户数据分析来针对性的营销客户,对提高银行效益十分重要。机器学习是从数据中获取有价值信息的重要手段,用机器学习技术对商业银行的客户数据进行画像建模,可以更加准确地分类客户。本文以机器学习为主对商业银行客户数据进行分析,构建商业银行客户画像模型,并将该画像模型对客户的分类应用于银行客户画像系统中,使得画像系统能够更加全面的展示客户信息。本文的主要工作包括:1.首先对商业银行客户数据进行数据预处理。因为生成对抗网络(GAN)相比于传统方法,能更好的模拟原始样本分布,生成高质量样本,所以将GAN模型应用于银行客户数据处理中,来解决存在的银行客户类别不平衡问题。同时将本文提出的GAN模型与常用的RUS、ROS、SMOTE、BSMOTE和ADASYN等类别不平衡处理方法进行了实验对比。结果表明,本文提出的生成对抗网络模型对于类别不均衡问题在正确率、召回率和F-measure等指标的综合度量上具有更好的效果。2.根据处理后的数据构建客户画像模型。本文采用两种模型结合的方式构建客户画像模型,来解决高维银行数据的难以精确分类的难题。首先使用因子分析对预处理后的数据进行降维处理,以保证降维后对原特征的解释性。然后以FCM算法构建客户细分模型,聚类出六类客户,并以布谷鸟算法优化FCM算法,提高模型的收敛速度,快速准确地学习数据特征,最终根据因子对各类客户总结描述。接下来再基于GAN平衡化的训练集,构建预警模型,预测客户流失。并将F-measure、AUC等指标作为度量标准,从随机森林、Xgboost、LightGBM三种方法中,选择最佳预警模型。最终将以上两种模型相结合,得出本文的客户画像模型,使客户精确划分为多类。3.为了便于银行业务人员对该银行客户全面分析的直接获取,设计并实现商业银行客户画像系统。基于所构建画像模型分析的客户结果,该系统可以对商业银行客户进行更全面分析展示并提供查询与预警的画像可视化展示。满足业务人员对客户的数据分析,有利于提高银行效益。本文使用多种机器学习方法对商业银行客户画像模型进行研究,使高维复杂的银行客户数据得以更加准确的分类,其中将GAN模型应用于类别不均衡处理,并通过对模糊均值算法的优化,提升了本文画像模型的整体效果。最后将本文画像模型对客户的划分应用于银行画像系统,实现了数据分析的自动化与可视化展示。
其他文献
<正>围绕水稻高产、优质、多抗等重要育种目标性状,在优异种质资源发掘及基因定位的基础上,突破功能基因高效发掘的技术瓶颈,结合基因组学、转录组学和表观基因组学等研究方
会议
植被覆盖度是用来衡量地表植被状况的重要指标之一.植被覆盖度及其变化也是区域生态环境变化的重要指标.拟基于郑州市1994年7月2日、2002年6月19日、2009年6月29号和2013年6
共享单车是分享经济与“互联网+交通”的结合,而催生出的一种新型的自行车租赁业务,其服务的便捷性、高效性、低成本等优点使得共享单车自出现伊始便广泛获得公众的认可与接受,用户数量也出现爆炸性增长,也激起了数家共享单车企业争相进入,2016年20多家共享单车企业同时进入市场,对市场监管形成了挑战。共享单车引起的市场混乱、用户安全等问题日趋严重,给相关部门管理带来新的治理难题,因此,如何对共享单车市场开展
<正>聚丙烯酰胺水凝胶(polyacrylamide hydrogel,PAHG)是应用于整形外科的一种新型软组织注射填充材料,1997年由乌克兰引入我国,主要在注射式隆乳术中应用。随着近年来注射式
会议
本文以沪深两市1999年到2006年制造行业上市公司的面板数据为基础,研究了制造企业投资率与政府政策利率之间的关系。研究发现,公司投资率与公司债务利率负相关,公司债务利率与政
<正>偏瘫手功能障碍的康复成为脑卒中后偏瘫康复的难点和重点。探讨偏瘫手功能康复的有效途径是康复医学工作者的重要课题。本文对偏瘫手功能障碍从以下几方面进行简述。1.康
会议
生活活动是一日活动的重要组成部分,生活活动中能促进幼儿良好生活习惯的养成和个性品质的发展,但在生活活动中幼儿难免会出现一些“失范”行为,而且幼儿的“失范”行为可能对幼儿自身和他人造成消极的影响,因此,为了幼儿健康成长,养成良好生活习惯和生活常规,减少失范行为的发生,教师对幼儿“失范”行为的回应尤为重要。本研究选取成都市两所幼儿园中6个小班的幼儿和6名初任教师为研究对象。运用观察法和访谈法,归纳出幼
采用ANSYS有限元软件,对叶片进行了空气介质与水体介质下的模态分析,提出了解决水体介质中模态分析的固--液耦合的方法,比传统的经验方法具有更高的计算精度,使叶片在水体中
客观分析了西安市推广应用水肥一体化技术的必要性,概括总结了西安市水肥一体化技术推广应用现状,深入探讨了实际推广应用中存在的问题,并在此基础上提出了进一步发展对策,以