基于大数据的金融风险预测算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:rscgmy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网金融的快速发展,银行越来越重视信用风险管理,降低不良贷款率,判别出存在较大违约风险的贷款客户便显得尤为重要,因此,对客户信用逾期风险的预测一直是金融业研究的重要方向。近年来,客户的不可靠性令银行近几年来的不良贷款率变得十分不乐观。准确评估和预测企业客户的信用风险是中国商业银行迫切需要掌握的一项风险管理功能。在大数据时代到来的背景下,本文根据用户基本属性数据以及下载APP种类的众多数据,实现特征提取并进行数据加权处理,进而利用带惩罚的线性回归来进行预测模型构建,提高对资不抵债客户的违约判别的准确性,实现局部优化,从而改善了对客户商业银行贷款的隐藏风险预测和管控,达到大大降低银行发放贷款的违约风险。针对所搜集的样本数据特征,选取了最适合的惩罚线性回归预测算法,并进行实验分析,以期提高银行的风险管理水平。本课题主要研究的内容及成果如下:(1)通过对互联网行业当中的涉及大数据应用等成熟技术进行调研以及分析,最终确定采用pandas及numpy来进行数据的初步读取和处理,并且对原始数据进行清洗及整理。(2)对于多方面数据整合,选择采用TF-IFD方法对客户下载APP数据进行特征提取,提取完毕后将APP数据与客户基本属性数据进行合并,从而完成数据整合工作。(3)针对贷款违约的不平衡数据集预测出现过拟合的问题,提出了对普通惩罚线性回归算法进行加权处理,并针对不同惩罚系数以及是否加权的四种组合情况进行对比试验验证。最终通过混淆矩阵、精确率、召回率以及准确率对四种情况作出最优选择。
其他文献
在中国革命和建设的历史进程中,毛泽东把马克思列宁主义关于知识分子的基本理论与中国实际相结合,形成了比较系统的知识分子思想,这既是对马列主义知识分子理论的继承和发展,也是
对于正系统来说,如果系统的初始状态非负,那么系统在接下来的时间里都将保持非负状态。正切换线性系统(以下简称PSLS)是由多个正系统以及切换信号构成,因此PSLS同时具备正系
日前,由宝钢股份研究院负责起草的国家标准《辉光放电光谱法定量分析钢铁表面纳米尺度薄膜》,通过了全国微束分析标准化技术委员会的评审。评审专家还建议,鉴于该标准在国际上亦
城乡一体化承栽着城市的发展之重,寄托了农村的未来之望。党的十七大作出了城乡经济社会统筹发展的战略部署,组织工作如何顺应城乡一体化发展形势,是当前和今后一段时期必须面对
应用单克隆抗体酶联免疫吸附试验检测35例结核性脑膜炎、28例其它脑膜炎和102例脑非膜炎患者脑脊液中的的结核杆菌抗原和抗体。结果显示结核患者脑脊液特异性抗原和抗体水平
理想主义精神是马克思主义批判性和革命性的精神源泉、思想标准、终极目标和价值追求。这种理想主义精神的理论前提是实践观基础上的理想概念,思维方式是方法论视野中的理想本
如何预防小儿佝偻病文/杨锋在医院儿科咨询门诊中,常有许多家长带着孩子来看医生,有的问医生,孩子夜间哭闹,烦躁不安,后脑勺的头发都掉光了,你看看是不是佝偻病?有的问,我这孩子都一岁
粒子图像测速技术(Particle Image Velocimetry,PIV)作为一种全流场非接触测量方法被广泛地应用于实验流场测量中。近年来,由于高能脉冲激光器和短跨帧时间、高分辨率CCD相机
尿沉渣图像检验是临床上体检和诊断泌尿系统疾病的重要方法,而传统的检查方式是通过人工显微镜观察实现的。这种方法因存在缺陷而影响诊断结果的准确性,如工作量过大,长期以