基于机器学习的商业银行潜在客户挖掘

来源 :南京审计大学 | 被引量 : 1次 | 上传用户:yangjianglong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习算法在金融行业发展落地,商业银行研究潜在客户挖掘问题方面多了更多的研究方法。了解哪些特征能够更加有效实现对重要客户需求的分析,从而给商业银行运营系统有效建议,是银行当务之急的研究方向。使用人工智能等新兴技术,不仅可以提高银行的资产管理水平和客户服务能力,而且有利于提高基层运营能力,更好抓住客户服务需求点。论文着重对潜在客户挖掘模型进行构建和优化,横向比较主流机器学习算法应用在金融信息类数据集上的优势与不足。实验所用数据集为国内某大型商业银行的真实客户信息数据,包含用户基本信息、金融投资情况、第三方支付使用频率等内容。通过对数据集做数据预处理和特征工程工作,解析了数据的来源和结构,并对数据整体做了描述性统计,处理缺失值数据、删除无用特征列,并对部分数据进一步做了one-hot编码化、标准化、对数化等操作,使用网格搜索等方法对模型参数进行调优,对比逻辑回归算法、决策树算法、随机森林算法、XGBoost算法,进一步筛选高效模型。通过召回率、准确率、F1_score、混淆矩阵、ROC曲线、AUC值、KS值等评价指标完成对模型的全面比较,得出XGBoost模型更适用于金融信息和潜在客户挖掘方面的结论,模型实现较好的预测结果。通过研究得出以下重要结论:1、逻辑回归算法不能很好的适应金融信息分类问题,但是后续仍然可以尝试通过卡方分箱和重要特征选取等方法解决关键问题,对模式进行调优。2、XGBoost在金融信息分类中表现较好,其模型优化后在测试集上AUC值为94.78%,各类评价指标均高于其他算法。3、通过对数据集特征重要性度量可以发现,转账流出最大金额、转账总金额、月均交易金额等交易类数据拥有更高的权重,在银行的基层个人客户经理可以以此为发掘点,着重关注客户转账交易情况、尽可能挖掘出优质潜在客户,提高银行效益。
其他文献
近年以来,我国债券市场进入快速发展阶段,信用债市场与社会信用逐步扩容,债券融资正成为企业主要融资渠道之一,但所带来的便是高杠杆经营的负面效应,进而产生连锁效应使得企业资金链脆弱而导致财务、经营风险升高,债务违约事件频频发生。其中,民营企业债务违约问题尤为严重,妥善解决债务违约问题成为企业的当务之急。因此,选取代表性民营企业债务违约事件进行研究,不仅可以深入探讨宏图高科债务违约诱发成因,并能以此为支
学位
近年来,社会经济活动的复杂性和不确定性为会计师事务所带来了多重风险的冲击,日益增加的审计风险使得事务所面临着巨大隐患。部分会计师事务所为了追求进一步的发展,急速扩张审计业务,但抵御审计风险的能力并不足以满足审计业务的需求,其风险管控水平提升的需求日益迫切。会计师事务所有必要准确识别并有效防御审计风险、提升审计风险管控的能力,进而开展有效的审计风险管控工作。与此同时,审计准则制定部门为应对披露更多审
学位
很多地方性氢能产业政策都优先于国家中长期发展规划出台,氢能产业政策编制质量直接关系到我国氢能产业高质量的健康发展。文章系统地梳理了国家和地方氢能产业政策发展脉络,检索了2017年1月1日至2022年6月1日期间发布的地方性氢能产业政策,聚焦于发展目标、技术路径、应用场景和扶持政策4个维度对政策内容进行文本量化分析,挖掘典型城市氢能产业发展规划的政策特征。研究结果表明:我国地方性氢能政策整体上在发展
期刊
审计是我国治理体制的监督体系,在保障经济健康发展、加强廉政建设等方面发挥了重要作用,而经济责任审计是我国特有的一种审计形式,客观评价领导干部任职期间经济责任的履行情况,既完善了干部管理制度,又增强了政府公信力。然而,在高度信息化的社会,海量审计知识在互联网中呈碎片化分布,常用搜索引擎又常夹杂着广告,审计人员难以精准获取审计知识。为解决这一问题,本文以经济责任审计知识为例,构建审计主题知识库。旨在为
学位
近些年来,在许多领域,如计算机视觉、模式识别等,图像识别技术得到了广泛的应用。在图像识别的过程中,特征提取这一步对于图像的识别准确率存在很大影响,现有的许多算法只有在图像噪声较小或无遮挡时才能取得较好的效果,但在实际场景中,图像往往存在各种噪声,例如光照、阴影、遮挡等,面对这些图像时,算法的识别能力会大大降低。因此,本文基于低秩回归与低秩表示的特性,并且结合流形学习与非负矩阵分解,针对遮挡图像,提
学位
随着互联网的快速发展,以新浪微博为代表的社交媒体逐渐成为人们传播信息的主要平台。社交媒体为人们共享信息带来了便利的同时,也为网络谣言的传播提供了途径。谣言在社交媒体上广泛传播会破坏网络环境,影响社会生活,所以对网络谣言实现自动化检测对维护社会稳定、保护人民利益具有重要意义。传统的谣言识别方法在提取微博的特征时,忽略了谣言关键词的词频信息和微博正文文本深层语义特征提取的重要性,故本文根据词频信息从谣
学位
在经济全球化背景下,市场竞争日趋激烈,加之我国经济增速放缓,创新已成为我国经济发展的重要竞争优势。企业既作为市场竞争的主要参与者,也作为国家的经济主体和创新主体,其创新绩效既决定了企业的市场竞争力,也决定了国家的创新水平和经济发展。因此,探讨企业创新绩效的影响因素具有重要的现实意义。现有研究多以单一教育背景指标衡量高管教育背景,以考察其对企业创新绩效的影响,一方面并未构建一个复合型教育背景指标衡量
学位
目的 分析护理管理风险在胆结石患者中的应用价值。方法 研究起止时间:2019年6月至2022年6月;样本例数:98例;分组方式:随机分组;组别:对照组、观察组,各49例。对照组:常规护理模式;观察组:护理管理风险模式。分析两组患者的满意度情况。结果 观察组总满意度高于对照组(P <0.05)。结论 将护理管理风险模式应用在胆结石患者中的效果显著。
期刊
图像分类是机器视觉领域一个研究热点,近年来受到越来越多的关注,图像分类作为机器视觉的基础性研究,极大的促进了计算智能和机器学习的发展。由于现实环境的复杂多变性,使得图像分类遇到众多的技术难题。本文在分析现有流形学习和线性回归算法基础上,对图像多分类识别算法进行了深入研究。归纳起来,本文的研究工作及创新点包括以下几个方面:(1)针对线性回归分类(LRC)未关注数据的局部结构信息,忽略了类内样本之间的
学位
2019年6月,上海证券交易所宣布“科创板”正式开板。随后2020年8月,深圳市表决通过了《深圳经济特区科技创新条例》,允许在深注册的科技企业实施“同股不同权”结构。资本市场一系列政策的逐步推进,为我国企业实施股权制度改革带来了突破式的发展。双重股权作为“同股不同权”制度的代表,其根本特征是将股东的现金收益权与投票权分离开来,使得公司创始人或核心股东通过持有少量的股权就可以实现对公司的绝对控制。合
学位