基于数据挖掘的银行客户行为的分析与研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:anonyjim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
银行客户行为分析是指通过收集客户的商业行为、客户特征、客户忠诚度、需求和偏好等方面的一些相关数据和信息,根据得到的信息和数据对客户进行划分,为客户提供个性化管理策略的过程。由于数据挖掘算法能够从大量数据中挖掘出数据之间的规律,因此目前被广泛应用于银行客户行为分析中。随机森林作为一种经典的数据挖掘算法,有着泛化能力强、分类预测准确度高、训练速度快,容易并行化实现等优点,非常适用于银行客户信用分类的场景,能够帮助银行进行客户行为分析。作为一种组合分类器算法,随机森林的整体分类性能由作为基分类器的决策树决定。由于随机森林在构建过程中具有随机性以及训练数据集的复杂性,因此会生成部分分类性能较差且相似度较高的决策树,影响模型的整体分类性能。此外,在筛选随机森林中的决策树时,现有的性能评价指标往往不能兼顾决策树的多样性和分类准确性。本文针对上述问题以及现存方法的一些不足,开展基于改进随机森林的客户信用分类方法的研究。本文首先研究了银行客户行为分析与数据挖掘算法的相关理论,对数据挖掘算法在银行客户行为分析中的应用进行了体系划分和分析比较,从而发现数据挖掘算法与客户行为分析之间的关联,为后续研究奠定了理论基础。针对传统随机森林算法存在的问题,提出一种评价决策树的综合性能指标,该指标可以在决策树的多样性和分类准确性之间进行折中,使得决策树的性能评价指标更为全面,能够有效地对森林中的决策树进行筛选。在此综合性能指标的基础上,对传统随机森林做出改进,提出了一种兼顾准确性和多样性的随机森林客户信用分类方法。实验结果表明,该方法有效提高了随机森林模型的分类性能,并能灵活应用于不同的客户信用分类场景中。最后,本文将理论与实际相结合,设计并实现了基于改进随机森林的客户信用评级原型系统。该系统采用了本文提出的基于改进随机森林的客户信用分类方法,包括数据采集、数据处理、模型管理和评级与分析四个模块,系统测试结果表明,该系统能够很好的完成客户信用分类的任务。本文的研究成果可以为数据挖掘在客户行为分析领域的研究提供新的思路,与此同时还可以将其投入实际应用,具有较高的理论价值和广阔的应用前景。
其他文献
纳米晶金属材料是指晶粒尺寸三维均在纳米尺度的多晶体金属材料。自上世纪九十年代初纳米晶金属材料的概念被提出以来,这种全新的亚稳态金属材料一直是材料领域研究的热点之一。一方面,极为细小的纳米晶粒和高密度的界面带来的接近极限的细晶强化效果赋予纳米晶金属材料具有超高的强度,使其成为具有广阔应用潜力的新一代高性能结构金属材料。另一方面,纳米晶金属材料表现出的微纳尺度上的独特变形机制加深了人们对塑性变形本质的
能源是人类社会发展和物质文明建设的重要基础,能源安全问题已经成为我国经济社会发展的战略重点。我国油页岩资源具有地质资源量大、开发技术难度大和开发潜力大等三大特点。地下原位转化开采技术是油页岩工业化开发的主要发展方向,但距商业化应用还存在一定的距离。高效加热裂解油页岩是油页岩原位转化的关键技术之一。根据油页岩原位转化存在的加热方式单一、能量消耗大和转化效率低等技术问题,论文提出可以利用油页岩裂解后残
清洁的水是维持人类生命活动和生态系统稳定的基本资源。然而,随着人口的不断增长,水资源短缺问题引起了人们更多的关注。在需水量大的食品、纺织、金属、造纸和化学工业中,对产生的废水进行回收和再利用将大大减少对水资源的消耗,可以在很大程度上缓解淡水资源短缺所带来的压力。膜分离技术作为一种新兴的途径,不仅可以淡化海水和微咸水,还可以用于废水回收。该技术具有效率高、易于操作、成本低和能耗低等优点,是可持续环境
环氧树脂(EP)具有优异的尺寸稳定性和突出的力学性能,被广泛的应用于电气和航空航天等众多领域中。然而,受其自身结构与元素组成的限制,EP极易燃烧。因此,提高EP的阻燃性能变得至关重要。现代工业中生产的阻燃剂能够在凝聚相与气相中对火焰的传播起到抑制作用,但一些阻燃剂会对环境与生态的发展带来危害,已经被禁止使用。因此,人们开始试图设计并制备具有新型分子结构的环境友好绿色阻燃剂。生物质材料具有绿色可再生
背景:前列腺癌是全球男性患者中最常见的癌症之一,在全球男性恶性肿瘤发病率中位列地二。据2021年在CA Cancer J Clin中发表的统计数据显示,2020年全球新发前列腺癌约有1414000例,死亡病例约375000例。而近几年前列腺癌的发病率和死亡率在很多国家不断地攀升。针对前列腺癌,现有的治疗手段主要有观察治疗、手术治疗、放射治疗、内分泌治疗、化学疗法等。对于早期局限性肿瘤,一般采用观察
研究背景:肥胖所致的机体糖脂代谢异常是包括高血压、动脉粥样硬化、心房颤动、左室肥厚、心力衰竭等在内的心血管疾病的高危因素。肥胖性心肌病是与其他心血管疾病致病因素无关,仅由肥胖所致的心肌代谢异常、结构改变和功能障碍。当今,肥胖性心肌病正在成为世界范围内的一个亟待解决的公共卫生问题,但目前仍缺乏有效的且有针对性的药物治疗干预。目前所知的肥胖性心肌病致病机制包括氧化应激、炎症、代谢紊乱(胰岛素抵抗、葡萄
全无机铯铅卤(CsPbX3,X=Cl,Br,I)钙钛矿纳米晶,因其卓越的光电性能如狭窄的半峰宽,可调谐的发光波长,高的量子产率,长的载流子寿命和扩散长度,近几年受到研究者广泛的关注。此外由于其具有卓越的离子迁移特性,卤素离子容易在室温进行化学组分交换,从而使钙钛矿材料光学带隙可调,覆盖全可见光范围,这种简易低廉的室温制备工艺利于工业化的生产,有望在太阳能电池,发光二极管,激光器等光电器件取得实际的
逆转录转座子LINE-1或L1,是人类基因组中唯一有自主转座活性的转座元件。L1是基因组进化的主要参与者,塑造基因的形态和功能,与衰老和免疫相关;同时也导致基因组不稳定,诱导基因突变,与肿瘤和自身免疫性疾病相关。因此,针对调控L1网络的研究具有非常重要的意义。L1是先天性抗病毒免疫反应的内源性激活剂,L1活性过高会导致AGS疾病的发生进一步佐证了L1对细胞内固有抗病毒免疫的激活调控作用;然而人们对
背景与目的:乙肝病毒(HBV)感染是严重威胁人类健康的公共卫生问题,慢性HBV感染时,如果宿主无法产生足够的免疫应答,将形成感染后的免疫耐受。现有针对HBV感染的治疗方案仅能抑制HBV病毒的复制,难以实现慢性HBV感染的功能性治愈。在现有直接抗病毒药物的基础上,激活机体免疫系统,恢复抗乙肝病毒的免疫应答,是近年来研究的热点。固有免疫应答中的模式识别受体可以识别病原体相关分子模式,在被激活后,能够诱
背景:在发展中国家以及发达国家,肥胖是一个非常重要的公共健康问题。肥胖可以引起多种与心血管疾病相关的并发症,是心血管疾病(主要体现在心肌重构,心力衰竭)的重要危险因素。流行病学数据以及实验研究提示肥胖与心肌重构、心力衰竭之间的直接相关性。此外,随着人类活动及社会经济的发展,环境中的镉(Cadmium,Cd)含量增加,镉暴露对健康的威胁也是一个很严重的问题。流行病学研究表明镉暴露与心血管疾病之间有密