中国消费金融大数据征信研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:xiaocai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不完善的个人征信体系,是制约中国消费金融发展的根本因素。一方面,在政策引导下,低收入人群成为消费金融重点服务的对象。另一方面,由于低收入人群普遍缺乏信贷记录,消费金融从业机构必须通过“替代数据”考察其信用状况。这些“替代数据”数据量大、种类丰富、实时性强,具有很高的挖掘价值,是典型意义上的大数据。大数据与征信天然地具有联系,大数据处理流程与征信流程具有高度一致性。在大数据时代,信息技术的推动,使得大数据征信成为传统征信的重要补充。同时,相比于传统征信,大数据征信能够更好地支撑中国消费金融持久发展。在对比不同概念并结合实践现状的基础上,本文对消费金融及大数据征信的概念、中国消费金融大数据征信的范畴进行了界定,对中国消费金融与大数据征信的关系进行了剖析。同时,对支撑中国消费金融大数据征信的理论进行了探讨,具体包括消费理论、信贷理论、信息经济学以及互联网金融相关理论。本文认为,消费金融产品及服务的提供主体和大数据征信活动的实践主体,既可以一致,也可以不一致。在特定时期,消费金融从业机构参与大数据征信实践,是较为高效的展业方式。与此同时,中国消费金融与大数据征信关系紧密,大数据征信是中国消费金融发展的基石,中国消费金融是大数据征信应用的场景,两者相互促进、相辅相成。本文归纳了中国消费金融大数据征信的四种主要模式,即银行模式、电商模式、运营商模式、社交模式。本文分别从数据来源、业务类型、数据结构、客户群体、服务场景以及合规程度方面对各模式进行了分析,对各自特征进行了概括。与此同时,本文梳理了国内外消费金融大数据征信的典型案例。国内案例包括积极拥抱互联网的商业银行、电商旗下金融板块、运营商旗下金融板块、社交平台旗下金融板块、搜索平台旗下金融板块、个人征信试点机构、持牌消费金融公司以及互联网分期平台等。国外案例包括国际传统个人征信机构、国际消费金融大数据征信先行者以及国际新兴Fintech公司。通过对比分析可知,无论是国外还是国内,开展消费金融大数据征信的前提均是数据累积。相比于国外征信数据的交互贯通,国内征信数据存在严重的孤岛现象。除此以外,在个人信用评分上,国外从业机构擅长采用机器学习方法,国内则大多采用逻辑回归方法。个人信用评分是消费金融大数据征信的核心。当前,业界普遍基于标准评分流程进行个人信用评分。标准评分流程具有流程固定、操作简单、可解释性强、透明性高等优点。按照这一流程,本文利用国内知名消费金融公司的真实数据构建标准评分卡。与前人研究相比,本文使用的数据量及数据维度均更符合大数据征信理念。经过缺省值处理、异常值检测与处理、WOE分箱、IV值排序、相关性检验、逐步回归检验、训练集与测试集划分、逻辑回归模型构建、证权转换、评分效果分析等具体步骤,本文发现,基于标准评分流程构建的评分卡稳定性较高、评分效果尚可,但仍然存在较大的提升空间。在定性及定量分析基础上,本文认为,中国消费金融大数据征信存在两大问题:孤岛模式问题和评分方法问题。这两大问题分别在指标获取和指标提取上对大数据征信效果产生影响。针对孤岛模式问题,本文提出构建中国消费金融大数据征信交互模式。本文对交互模式的构建路径、外部数据拓展、统一标准制定、指标体系构建进行了阐述。交互模式的构建路径包括政府主导式、优势互补式、信息共享式。交互模式的外部数据拓展需要遵循互补性、可得性、稳定性、真实性等原则。交互模式的统一标准制定需要遵循普遍性、明确性、规范性、科学性、一致性、兼容性、系统性原则。交互模式的指标体系构建需要遵循多层次、可解释、易操作、利扩展、防漏损原则。统一标准制定的方式包括政府部门主导、行业协会协同、市场环境促成。指标体系构建的方式包括自上而下式、自下而上式。指标体系构建的架构包括分类架构、全交叉架构、分类单次交叉架构、分类多次交叉架构。本文认为,优势互补式是当前较为可行的交互模式构建方式,大数据交易所是当前最重要的外部数据拓展渠道,自下而上式是当前更为可行的指标体系构建方式,分类多次交叉架构更符合交互模式发展现状。与此同时,实证结果表明,PCA降维方法能有效应对大数据的“高维度、稀疏性、弱相关”特征,有利于交互模式指标体系构建,实现“以尽可能少的综合指标反映尽可能多的变量信息”的目的。针对评分方法问题,本文提出采用中国消费金融大数据征信集成方法。在重构标准评分流程的基础上,本文设计了大数据评分流程。与标准评分流程相比,大数据评分流程引入了机器学习方法。本文认为大数据与机器学习是相互促进的关系。作为机器学习发展的重要方向,集成学习包括三大要素,即基学习器的种类、集成方式以及结论合成方法。本文考察了两类基学习器,一类是以逻辑回归、决策树、K-近邻、SVM为代表的单一机器学习模型,另一类是以Boosting、Bagging、随机森林为代表的经典集成学习模型。本文认为,在选择基学习器时,应当兼顾一般性与特殊性、准确性与差异性、操作性与可行性、稳定性与灵活性原则。本文提出了四种集成方式,即同质学习器串行集成、异质学习器串行集成、同质学习器并行集成、异质学习器并行集成。在实证分析中,本文选取随机森林、Boosting、逻辑回归作为基分类器,采用异质学习器并行集成,通过概率打分法合成结论,分别构建了基于“随机森林+Boosting”、“随机森林+逻辑回归”的大数据评分卡。实证结果表明,本文构建的大数据评分卡效果优异,与此同时,并非所有机器学习模型经过集成后都能提升评分效果,“好而不同”思想至关重要。为促进中国消费金融大数据征信健康发展,本文认为,应当着力从三大方面推动交互模式及集成方法的落地实施,即加快消费金融大数据征信从业步伐、加强消费金融大数据征信层级联动、加强消费金融大数据征信基础支撑。具体措施包括:确立消费金融大数据征信从业标准、放开消费金融大数据征信从业准入、实施消费金融大数据征信从业监管、政府引导消费金融大数据征信开展、协会指导消费金融大数据征信实践、市场主导消费金融大数据征信过程、重视消费金融大数据征信人才建设、健全消费金融大数据征信设施配备、完善消费金融大数据征信隐私保护。
其他文献
区域内幼儿园教研共同体指某一区域范围内两所以上幼儿园为实现教师专业成长和提高幼儿园教研质量,从幼儿园保教活动的现实问题出发,在幼儿园教师、教研员、指导专家共同参与下,根据同质促进、异质互补的原则而构建起来的一种教研团体。区域内幼儿园教研共同体的建设对幼儿园教师专业发展、幼儿园可持续发展、区域学前教育均衡发展以及学习型社会化与终身教育的推进具有重要意义。本研究试图运用场域理论的视角探讨区域内幼儿园教
学位
城市群作为当今我国新型城镇化道路上的主力军,受到了学术界和政府部门高度地关注。自2005年,国家“十一五”规划中第一次提出要把城市群作为我国城镇化进程的主力军,一直到2014年,《国家新型城镇化规划》中正式提出把城市群作为城镇化主体形态,城市群当之无愧成为我国新型城镇化的中坚力量。研究表明,有竞争力的城市群,应当是有一个合理的层级结构,在这个层级结构内拥有一个“等级—规模”排序的城市集,而不是一群
学位
随着中国经济全面步入新常态,资源禀赋结构的转换和居民消费结构加快升级使得要素驱动型的粗放增长模式难以为继,“创新驱动,转型发展”成为中国重塑经济增长新动力的必然要求。中国政府不断提高对企业自主创新的补贴力度,以增强其市场竞争力。尽管理论上认为政府应该对企业创新进行补贴,以缓解创新活动的资金大、风险高、周期长及技术溢出带来的收益损失等问题,但在实际操作中,有关于政府补贴对企业创新的效果的争论却从未停
学位
自20世纪90年代末期起,以网上银行和第三方支付为代表的电子支付体系在中国不断普及和发展,这推动了中国电子商务的蓬勃发展,提升了中国流通领域的效率,也为整个中国互联网金融的发展奠定了基础。2013年下半年,随着“余额宝”的迅猛发展,第三方支付、网络借贷、众筹等模式各异的互联网金融在中国也出现爆发式发展,成为业界、学界,以及金融监管当局关注的焦点。随后几年,中国互联网金融维持强劲发展势头,各业务模式
学位
在长三角地区大力推进创意城市建设和经济转型背景下,发展文化创意产业成为各市转变经济发展方式的重要动力源泉。本文从提升城市经济转型能力的角度深入探讨文化创意产业与城市发展问题,在研究内容方面,突破以单体城市而是以城市群为研究对象。在研究方法上,通过规范分析、定性分析、实证分析,构建不同计量模型检验文化创意产业对长三角地区城市产业结构调整、需求结构调整以及空间结构调整的具体影响,具有一定的理论与应用意
学位
元结乃盛唐至中唐转折时期的文学家和政治家。本论文从以下几个方面探讨元结与中唐文学的关系及其影响,最终总结出元结在文学史上的地位:其一,对元结生平与思想进行系统化的探讨,从中得出新的认识。本论文第一章通过对元结的生平和文学创作的考察,深入探讨儒家思想和道家思想对元结的影响,并以此进一步勾勒其性格特点。同时,第一章也探讨元结所处的时代背景,以及此一时期文学发展的趋势。其二,对中唐文学研究进行新的开拓,
学位
薪酬契约是委托代理理论研究的核心问题,其对公司高管行为的激励一直是学术界研究的热点。近年来不断爆出公司高管的天价薪酬引起了人们的质疑,人们不禁要问:是什么原因导致公司高管薪酬越来越高?由此引发了人们对高管薪酬的广泛关注。一些学者从公司内部出发,对公司高管薪酬的影响因素及高管薪酬、公司高管之间的薪酬差距、公司高管与普通员工之间的薪酬差距对公司绩效的影响等问题展开了研究。另一些学者则从公司外部出发,研
学位
陀思妥耶夫斯基小说中有许多绝望的人物,研究他们的绝望不仅可以使我们更好地理解陀思妥耶夫斯基的创作思想,还可以帮助我们更深刻地理解作家在描述人物绝望时提出的问题。在以往的研究论著中,已有许多学者关注到了陀氏小说中人物的绝望,但这些论著多是借助这些人物表达自己的思想,并没有反映陀思妥耶夫斯基本人的观念。另一方面,因为缺乏对这些人物的整体考察和研究,使得我们对陀思妥耶夫斯基的理解有些片面和绝对化。描写因
学位
迈克尔·昂达奇(1943—)是当代加拿大最具影响力的作家之一。20世纪70年代至今,昂达奇共创作七部虚构类作品,《英国病人》令其成为首位荣膺布克文学奖的加拿大小说家,另外两部长篇小说,《安尼尔的鬼魂》与《遥望》,为其赢得总督文学奖、吉勒文学奖等诸多奖项,奠定了他在文坛的地位。与此同时,昂达奇也是加拿大最富争议的作家。他在小说中表现的为艺术而艺术的自觉意识,究竟切断了其作品与历史、现实的关联,还是促
学位
分子纳米磁体因其符合磁性的双稳态模型(1和0二进制信息的稳定存储),在未来的高密度信息存储、分子自旋电子学和量子计算技术中具有极大的潜在应用。在设计单分子磁体的过程中,因为重稀土离子的较大自旋以及由于旋-轨耦合作用而导致的超强磁各向异性,使得其成为制备拥有优异性能的分子纳米磁体的理想选择。环形重稀土基分子磁体,特别是含有奇数个重稀土离子的环形分子磁体,更是因为体系中所含有的奇数电子,使其成为研究自
学位