基于聚类算法的个人互联网消费贷款定价研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:Sampan_nb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,个人互联网贷款定价问题是许多金融体系重点研究的问题,关系到贷款双方的利益问题,是新型的互联网时代商业模式的新问题,相关的贷款定价技术也在不断取得进步,许多科学先进的贷款定价模型也如雨后春笋般涌现,相关的研究已经取得许多进展。
  贷款定价是商业银行根据自身资金成本、盈利目标以及贷款风险和期限,结合借贷市场资金供求状况和用户的贷款情况后才做出的定价决定。为了针对不同的用户群体,根据其个人互联网消费的贷款情况和用户的个人情况,通过设计出一个合理的模型针对不一样的贷款用户进行风险等级的评定,并结合其他的可选参数共同设计出一个尽量精确的分类模型,为用户匹配出个性化的贷款定价服务,以实现双方经济效益最大化,这具有非常大的实际意义。
  做个人互联网贷款定价研究,是互联网贷款在各大互联网行业中获得相对优势的重要条件,该研究在一定程度上有利于我国贷款产业中的资本调度和资源分配,同时,也有利于借贷平台进一步开拓金融市场。从传统模型的研究中不难看出,贷款利率的波动对贷款双方经济效益产生了深远影响。传统的模型或研究方法主要是基于贷款利率、个人收入和风险控制、市场制度等因素对贷款定价进行分析,本文针对个人互联网消费贷款使用了机器学习和大数据的技术进行建模,为影响贷款定价的主要因素做出了多角度分析,提出了适用于该应用的A-Kmeans聚类模型和混合结构为VGG19接入10层DenseNet结构和6层ResNet的分类模型,分别来解决用户风险定级问题和贷款定价问题。
  A-Kmeans聚类模型由AutoEncoder的数据降维和Kmeans聚类阶段组成,使用数据降维操作是为了能够将主要的数据特征进行压缩,以使得Kmeans算法能在低维空间中进行聚类,效果也相比于只使用Kmeans算法进行聚类高出近4个百分点;同时,为了实现模型对数据的拟合性,并且提高参数共享性,在AutoEncoder的自编码器中也使用了10层DenseNet结构和6层ResNet结构作为编码器和解码器,如此可以与数据分类模型中的这部分结构进行参数共享,最大程度上保证了在同一组数据中的模型共享性。模型当中使用VGG19的结构是为了能够轻便的提取数据特征;使用DenseNet连接机制是为了降低模型的复杂度、减少参数量、提高参数的共享性,缓解模型的梯度消失问题;使用ResNet是为了能够将重要数据特征进行规范化,使得模型的输出更贴近于分类数。论文在此基础上研究了与贷款定价和风险评估有关的主要因素有哪些,为客户的贷款业务提供个性化的定价服务,并在这个基础上将各个字段参数的作用结果进行可视化,清晰得出影响风险评估相关的字段参数之间的关系。
  以mAP指标作为评价模型的准确度指标,实验结果表明,在数据降维问题上使用的AutoEncoder模型实现94.5%的准确度,较PCA模型和LDA模型高出近5个百分点;在风险评级问题中使用的Kmeans模型实现88.3%的准确度,较Pmeans和DBSCAN模型高出近3个百分点;在贷款分类问题中使用的VGG19-10D-6R模型实现87.9%的准确率,较其他的特征提取器的准确率相当,但参数量小了近10MB大小,测试耗时短近10ms。DenseNet和ResNet结构的层数设计进行对比,贷款定价分类数进行对比,风险评级模型和贷款定价模型的分类数进行对比,发现10层DenseNet结构和6层ResNet结构作为分类器和编码器的效果较其他结构的准确率高近1个百分点,使用2个贷款分类数准确度高近2个百分点,参数量小近4MB,使用5个风险等级类高出近1个百分点,参数量小近5MB。本次实验发现影响风险评级的主要因素是贷款是否逾期与名下账户状态两个因素,影响贷款定价分类的因素主要是缴存基数和缴费工资两个因素。通过搭建科学的反馈系统,实时地获取到客户的反馈信息,不断地优化论文的模型,网络结构的泛化能力较强,模型表现优异,将来若模型可被部署在云服务器上,通过APP平台实时收集受贷客户的数据,并给出合理的贷款定价,同时根据定价结果及时反馈给模型新的数据信息以升级模型。
其他文献
摘要:农民是一个弱势群体,在政治、经济、教育、医疗、社保、社会地位等方面都享受不到城市居民的同等待遇,对此应从理论、体制、制度与政策上深入反省,用特殊手段解决农民问题,对农民进行第三次解放,即从小农经济向市场经济的解放。  关键词:农民问题;弱势群体;剪刀差;第三次解放  中图分类号:F321.1 文献标志码:A 文章编号:1673-291x(2007)03-0001-03    一、对农民问题应
期刊
摘要:在我国科技迅速发展的同时,反战不均衡的问题也越来越突出。我国科技反战不均衡主要表现在科技投入总量加速增长,但增长不平衡;地区间科技发展不平衡问题突出;从研究领域来看,基础性研发和社会公益类投入比例过低三个方面。因此,实现我国科技事业的均衡发展,必须逐步解决以上问题。  关键词:科技 均衡发展     当今社会,科技发展对经济发展的推动作用越来越大,而且科技因数对GDP的贡献率不断提高。我国
期刊
摘要:本文将企业的服务价值创新作为我国房地产企业可持续发展的重要研究方向,围绕我国房地产企业的可持续发展,从房地产企业可持续发展战略和价值创新的角度,试图结合我国房地产市场的变化特点及趋势来探索出一条适合于我国国情的房地产企业可持续发展的道路。  关键词:可持续发展 房地产企业 价值创新    一、我国房地产企业发展概述  (一)房地产企业可持续发展的含义和特征  房地产企业可持续发展可以定义
期刊
摘要:近年来,渎职犯罪作为一类特殊主体的犯罪,已成为一个十分严重的社会问题,它亵渎国家机关工作人员职务的公正性、廉洁性、勤勉性、严重侵犯人民群众的合法权益,扰乱国家机关的正常管理秩序,影响改革发展稳定的大局。本文主要就渎职犯罪的特征及防治对策发表相关见解。  关键词:渎职犯罪 特征 防治对策    当前我国渎职犯罪现状  2010年3月11日在第十一届全国人民代表大会第三次会议上最高人民检察院
期刊
摘要:我国已加入WTO并正按照世界贸易的规则要求加快金融业的对外开放。在经济全球化和金融全球化高度发展的今天,金融机构间竞争加剧,市场风险加大,如何保证金融活动高效安全的运作是世界各国共同面临的重大问题。存款保险制度是维护金融业稳定的重要制度,它的建立可以有效激励金融机构保持充足的资本,控制金融成本,保护存款人的利益。我国目前尚未建立存款保险法制制度,建立该制度,将有利于维护我国的金融安全,营造公
期刊
摘要:针对全球饥荒问题,有关学者提出,贸易自由化是解决此问题的良方。然而,现实情况是,随着农产品贸易自由化的推进,全球饥荒问题变得更为严峻,这就使我们不得不重新审视农产品贸易。农产品贸易的合理定位,为全球饥荒问题的解决提供一个新的视角,同时也为农产品贸易研究提供了一个更为合理的前提。  关键词:农产品;贸易;定位;粮食安全  中图分类号:F304.2 文献标志码:A 文章编号:1673-291x(
期刊
在现代经济生活中,信用一词已逐渐被我们所熟知,如住房贷款、购车贷款等都与信用有关。在经济学中,信用是一种借贷行为,是以偿还和付息为条件的单方面的价值转移,是一种特殊的价值运动形式。所谓个人信用体系是指对个人的收入、资产、已发生的借贷情况以及对个人的信用等级进行评估等资料进行随时记录和存档的一种制度。其主要目的是为证明、解释和查验自然人信用情况提供依据,并通过一系列法规、制度来规范个人信用活动当事人
期刊
电子制造业的新产品导入是产品从设计阶段转到量产阶段的一个过程,是一个典型的项目执行过程,对于项目风险应按照项目管理专业的知识体系来管控。对于电子制造业的新产品导入项目来说,传统项目风险管理模式存过程繁琐、风险规划措施不合理、风险应对效果不理想等情况。本文以C公司在F工厂进行的S项目为例来阐述如何将新产品导入项目风险管理的相关业务流程数字化,并分析数字化后对新产品导入项目风险管理带来的改善。
  首先,本文运用头脑风暴法、专家意见法、流程图法等风险识别方法列出了S项目的风险清单,然后运用FMEA方法对
摘要:2005年12月15日,中国建设银行推出国内首单个人住房抵押贷款证券化产品“建元2005-1个人住房抵押贷款支持证券”,标志着我国在资产证券化的实践与探索中又迈出了新的一步。提前偿付风险在住房抵押贷款证券化过程中是不可回避的。因此,对提前偿付风险的管理就显得更加重要。贷款层面的收益率维持模型及结构层面的CMO都能够作为很好的风险管理手段应用于住房抵押贷款证券化。同时,我国在MBS提前偿付风险
期刊
摘要:以中介法为基础,将反映银行自身能力的投入指标纳入测算银行效率当中,以总资产、劳动力、能力指标为投入,净利息收入、非利息收入为产出,采用超效率DEA模型测算了我国商业银行的运营效率、服务效率及单项投入的利用效率。进一步分析了各效率之间的关系,得出如下结论:目前,我国商业银行的运营效率与服务效率相关性较低,属于低度相关;国有银行和股份制银行的总资产利用效率差异不大;与我国商业银行服务效率相关性由
期刊