基于多源数据融合的个人信用评分卡模型的应用研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:HillTang00009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国经济取得了飞跃式的发展,广大人民对物质文化的需求不断发生改变,人们的消费观念也随之有了很大的改变,“提早消费”的观念正在被越来越多的人们接受,尤其是被年轻人广泛接受,消费贷的热度在不断攀升的同时带来了一系列的问题,比如存在着多头借贷和高违约率等现象。一方面在数据来源上,一些可以用于反映信用的数据分散在多个金融机构中,难以有效的整合,数据的使用效率被大大降低,且以往的研究大多集中于对方法的创新和改进上,忽略了对数据集的探索。另一方面从模型方法上,当前的机器学习模型对违约人群的预测精度较高,但存在解释性差的问题,传统的基于逻辑回归的信用评分卡模型可解释性强,稳定,但是精度不如机器学习模型。针对这些问题,本文主要利用包含了用户身份财产信息、银行卡信息、交易信息、偿还贷款信息、发放贷款信息、申请贷款信息、多头借贷信息的多源数据对个人信用风险进行评估,将XGboost等机器学习和基于逻辑回归的传统信用评分卡模型组合为融合的信用评分卡模型,以达到在多源数据环境下增强模型的预测精度和可解释程度的目的。本文的主要工作具体如下:第一部分首先阐述了文章的选题背景和研究的理论意义,其次对国内外关于信用评价领域的文献进行了研究和梳理,再次总结了本文的研究内容和论文框架,最后对本文的创新点进行了说明总结。第二部分主要是介绍了信用评价模型的相关理论和方法,包括了以逻辑回归模型为基础的传统信用评分卡模型和XGboost等集成学习方法,并且对模型的评价指标进行了简单的概括和描述。第三部分对多源数据融合的基本思想和研究方法进行了阐述,首先说明了多源数据融合的界定和特征,其次对于多源数据融合下数据的处理方法进行了说明,包括数据不平衡的处理,数据缺失值和逻辑错误的处理等,最后对多源数据融合下的信用评分的特征进行了说明。第四部分首先介绍了本文选取的多源数据的基本特征,对多源数据间的逻辑关系进行了梳理,删除存在逻辑错误的样本,其次根据数据来源不同对数据缺失值分别进填补处理,再次分别构造了多源数据下传统的信用评分卡模型和单一的XGboost集成学习模型,最后分别对两种模型进行KS和AUC等指标的评价。第五部分是多源数据融合的信用评分卡模型的构建,首先构造了多源数据融合的子评分模型,其次构建多源融合数据的信用评分卡模型并评估模型的性能和稳定性,最后对传统信用评分卡模型、XGboost集成学习模型和多源数据融合的信用评分卡模型进行模型的对比,最终结果发现多源数据融合的信用评分卡模型效果上优于传统的信用评分卡模型和单一的XGboost机器学习模型。第六部分主要是本文的结论与展望,总结了本文的主要结论,并且对以后多源数据融合等研究方向进行了展望。通过本文的研究发现,与单一的用户消费数据相比,数据进行融合后的多源数据能较为全面的涵盖用户各方面的特征,通过分别对不同来源的数据分别建模并最终进行组合的信用评分模型能对用户的信用行为进行较为精准的刻画。本文的创新点主要是探究了多源数据融合视角下的信用评分卡模型的构建。融合了用户不同场景,不同来源的数据,包括用户的身份及财产信息、银行卡信息、发放贷款信息、偿还贷款信息、交易信息、申请贷款信息和多头借贷信息,对多源数据分别构建子评分模型,实现了机器学习方法和传统信用评分卡模型的融合,将机器学习模型的输出结果最终转化为直观的评分卡,构建了基于多源数据融合的个人信用评分卡模型。
其他文献
近年来,随着“中国制造2025”战略的提出,国家对职业教育的重视程度也是日益增加,相继出台了一系列促进职业教育发展的政策,在政策推动下,目前,中国已成为世界上职教规模最大的国家。面对产业结构转型升级和中国经济“三期”叠加的新形势,职业教育要从以往规模扩张向内涵建设转变,而教学方面的内涵建设要将先进的教学理念融入课程教学之中。成果导向(OBE)作为一种先进的教育理念在国内已有数十年的研究和实践历史,
SD公司是位于江苏省靖江经济开发区的一家民营股份公司。SD公司虽然在2009年就初次导入了ISO9001质量管理体系并进行了第三方机构认证,但关于领导作用、全员参与等质量管理原则并没有被SD公司真正理解并广泛运用,现有ISO9001质量管理体系存在整体低效、局部条款无序且失效运行的问题,对SD公司进一步经营发展和业务规范运作带来了极大的妨害。在此背景下,SD公司拟引入美国石油学会开发的石油工业质量
随着中国综合国力的提升,在国际上的地位也日益提高,中医药的科学价值和作用越来越受到各国和各地区人民的认同和喜爱,这就对中医药企业的发展要求进一步提高。中医药企业无论是产品研发还是产品生产,都离不开人员的参与,如何解决人员与薪酬之间的关系,留住稀缺的中医药人才成为中医药企业生存发展的关键所在。因此,一套合理有效的薪酬体系成为中医药企业探索发展的关键要素之一。BC公司是一家民营中医药企业,经过多年的经
旅游业对全球国内生产总值的贡献超过许多其他经济部门,同时,旅游业带来的二氧化碳排放也引起世界各国的高度重视,必须采取有效措施降低二氧化碳排放。中国旅游业发展迅速,1991-2018年旅游业碳排放年均增长率达到9.91%。作为发展中国家和碳排放大国,中国区域经济的发展和环境保护之间的协调尤显重要,此时,旅游业区域碳补偿可以成为其实现的一个有效手段。旅游业区域碳补偿是一项既重要又具有挑战性的任务,需要
股价同步性即市场上股票存在的“同涨同跌”现象,同步性高意味着股价中包含公司的特质信息较少,市场上与公司相关的特质信息的“质”与“量”正是资本市场能否健康有效运行的关键。“同涨同跌”这种现象会使股价反映的公司价值不准确,使公司价值背离其真正价值,从而加剧市场上潜在的风险,不利于证券市场健康有序发展。近年来我国交易所开始逐渐加强对公司的监管力度,越来越关注上市公司披露的信息是否真实、准确、完整。据此,
基础设施是经济平稳发展的重要基础,也是发挥政府职能,实现城市功能的重要载体,针对基础设施影响经济增长的研究早已有之。但是,早期国内外学者在对其研究时,多未引入空间因素的影响,随着计量经济学研究的不断深化,学者将空间因素纳入研究范畴,发现若不考虑空间效应的影响,将会导致估计产生偏误。同时,江苏省作为长三角地区的主要省份,在引领全国经济高质量发展、完善我国改革开放空间布局中扮演着重要角色,研究江苏省基
共享经济是依托于网络平台,旨在使资源得以最大化利用、最大限度节约公共资源和自身资源的经济活动。它是实现买卖双方精准匹配、盘活闲置资源、强调消费体验,倡导可持续发展的一种新型网络经济形态。共享短租通过让渡闲置房屋资源的使用权来实现共享。在共享短租平台上,房客通过房东披露的信息及其他房客的评论选择是否入住。与此同时,房东可以根据用户评论反馈的信息了解用户的体验情况、自身房源或服务的不足之处,为房东修改
面对目前全球气候持续变暖的现实背景,缓解气温持续上升问题已然成为世界各国达成的共识。为此,世界各国均纷纷提出了自己的节能减排目标,并积极采取节能减排措施。2017年,作为发展中国家的中国释放的二氧化碳排放量的世界占比约为27%,已经远超位居其后的美国(15%)和欧盟(10%),高居世界碳排放总量排名第一位。为解决中国碳排放的问题,在2009年,中国政府提出了到2020年中国碳强度同比2005年下降
阅读教学是语文教学的重要组成部分,也是很多专家、教师研究的热点。在小学语文阅读教学研究中,文体意识一定程度上似乎被忽略,很多人认为文体对于小学生而言太难,跟小学生讲文体,似乎是拔高行为。但是文体意识并不等同于文体知识。随着近几年教改的发展,小学语文阅读教材以及课标中都有文体相关的论述,尤其2019年,全国教材改版和统一后。新的部编版教材中更是凸显了文体意识的重要性,面对新的教材,新的教改,如何在小
近年来,我国城市生活垃圾的产生量不断增加,垃圾治理成为日益凸显的管理难题。对城市生活垃圾进行分类治理,一方面体现着城市精神文明建设和精细化管理水平,另一方面关系到居民身心健康和生活环境的改善。2016年,国家提出了建设城镇生活垃圾强制分类制度;2017年,国家发布《生活垃圾分类制度实施方案》,方案提出要在全国直辖市、省会城市、计划单列市以及部分生活垃圾分类示范城市等先行实施生活垃圾强制分类;202