基于Boosting-SVM算法的P2P网贷平台违约风险识别方法

来源 :东北财经大学 | 被引量 : 5次 | 上传用户:chaoyuemengxiang2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网金融产品是随着我国经济持续稳定地高速发展和互联网在人们生活中的不断渗透的大时代背景下的必然产物。P2P网络借贷是互联网金融最具代表性的模式。P2P网络借贷平台作为一个信息中介平台,能够有效地将借贷双方联系在一起,为借贷双方共同创造价值。P2P网络借贷行业在经过几年的野蛮生长后,产品的综合收益率逐渐回归理性状态,成交量也逐渐地稳定下来,整个P2P网络借贷行业进入了一个稳定发展的阶段。尽管P2P网络借贷平台可以为借贷双方创造价值从而实现盈利,实际上P2P网络借贷平台承担了很大的风险,其中由于借款方违约导致的坏账风险是每个合法的网络借贷平台面临的最大风险问题。在P2P网络借贷行业进行稳定发展阶段后,P2P网络借贷平台之间的竞争不仅体现在产品和服务中,更为核心的竞争体现在平台对于借款人违约风险识别的能力上。提高违约风险识别能力能够帮助P2P网络借贷平台更加健康地发展。本文提出判断借款用户是否存在违约可能而导致坏账的风险问题可以转换为一个模式识别分类问题来研究。借助机器学习和人工智能的方法充分识别违约坏账风险,可以有效地帮助P2P网络借贷平台降低坏账风险发生的概率,促进网络借贷市场的健康发展,使其更好地服务于社会主义市场经济。支持向量机是机器学习中最为常见的分类算法之一,既可以处理分类问题也可经转换后用于处理回归问题。在解决样本量少、高维度数据集和非线性模式识别问题中,支持向量机学习算法比其他机器学习算法有着更独特的优势。此外,支持向量机学习算法具有坚实的理论基础和简单明了的数学模型。AdaBoost算法作为集成学习中非常重要的一部分,其分类算法思想是针对那些容易错误分类的训练样本增加其样本权值,并通过不断地学习,尽可能地减少分类错误的样本数量。AdaBoost算法通过构造一系列简单的初级预测方法,将它们按照一定的规则组合能够得到一个复杂的、精确度高的分类预测方法。针对于支持向量机在处理大样本训练集时运算效率低和AdaBoost算法在处理高维度模式识别问题精确度不高的问题,本文提出了结合支持向量机和AdaBoost算法框架改进形成的Boosting-SVM算法。Boosting-SVM算法将弱化处理后的支持向量机作为AdaBoost算法框架中的基本分类器,将每轮训练样本的样本权值加入到支持向量机优化问题的目标函数中,利用序列最小最优化算法进行求解得到基本分类器,并将每轮迭代得到的基本分类器进行线性组合得到最终的分类器。支持向量机的弱化处理是通过选择部分训练样本子集进行训练达到弱化效果。将训练样本的样本权值加入到支持向量机优化问题的目标函数中能够让不同样本的惩罚项不相同,因此不同样本权值的样本能够得到不同的重视程度。在利用序列最小最优化算法对支持向量机进行求解时,将训练样本的权值加入到支持向量机原始优化问题的目标函数中,因此在求解过程中缩小了变量的不等式约束范围上下界。本文首先利用机器学习公开数据集Breast-Cancer数据集在原始支持向量机和Boosting-SVM算法进行实验,验证了 Boosting-SVM算法改进的有效性。P2P网络借贷用户的实验数据是利用网络爬虫在P2P网络借贷平台上采集的相关信息。P2P网络借贷用户数据集经过一系列特征工程处理后可以直接用于模型和算法计算,将经过特征工程处理后的P2P网络借贷用户数据集在原始支持向量机和Boosting-SVM算法上进行实验,根据最终的实验结果可知,Boosting-SVM算法在精确率和计算效率上都要优于原始支持向量机,因此,Boosting-SVM算法能够更加有效地帮助P2P网络借贷平台识别违约风险。
其他文献
目的比较经腹子宫全切术及腹腔镜辅助下阴式子宫全切术治疗子宫良性病变的临床效果。方法选择2013年1月至2015年12月期间于我院确诊并行子宫全切术的良性子宫病变患者103例,
针对目前我国汽车的形势及其停车位的现况,分析介绍了立体式机械停车场(库)的特点和性能,总结了该停车场在现实应用中存在的客观不利因素,依据我国汽车快速发展的形势推断出:工停车
土工织物在沥青路面养护中的应用王爱军赵维启(辽宁省北宁市公路管理段北宁121300)土工合成材料是以高分子聚合物为原料的新型建筑材料,广泛应用于土木工程中。土工合成材料种类很多
目的:探究脂肪肝的发病率与患者胆囊切除之间的关系。方法:对我院2018年5月—2018年6月进行体检的2678例体检者的体检结果进行回顾分析,对比180例胆囊切除患者与未实施胆囊切
营销计量自动化系统在电力营销中应用广泛,在很大程度上促进了电力营销的进步,为电力营销行业的发展做出了巨大贡献。计量自动化系统在电力营销中发挥着很重要的作用,一方面减少
所谓的数据挖掘其实就是指在信息库中发现信息,现阶段,数据挖掘是信息技术领域中比较热门的一项研究。在企业信息服务中,数据挖掘的作用可谓是至关重要。笔者以企业信息服务
酶在防粘纸生产中的应用Theuseofenzymesintheproductionofreleasepapers通过应用各种工业酶使制浆造纸过程中的工艺条件有利于生态环境且经济合理。这些应用是:·高速纸机抄纸纤维的改性或改进某些纸种的纸张质量。&#18
《国家科学和技术中长期发展规划纲要》明确提出要完善技术转移机制,大力发展为企业服务的各类科技中介服务机构;国务院常务会议通过的《关于发挥科技支撑作用,促进经济平稳较快
Bauer-McNett纤维筛分仪的引进及消化应用姚纯仁,刘秀荣,刘英齐齐哈尔造纸厂研究所(16100)Bauer-McNettfiberclassifier¥//编者按:鲍尔筛分仪(Baner-McNett)是一种研究和评价纸浆质量的很有效的仪器,...