基于自适应惩罚Logistic回归的个人信用模型研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:hml9061
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国自20世纪80年代以来,信用卡业务得到了长足的发展。随着互联网信用借贷的兴起,传统信用借贷行业迎来了新一轮的增长,由此引起了对客户信用问题的重视。数据挖掘技术评估信用卡客户个人信用的重要性日益显现。1.对Wilcoxon惩罚Logistic回归算法进行改进,提出了 E-Wilcoxon惩罚Logistic回归算法。基于Wilcoxon秩和检验的思想,计算各个特征变量的秩次,用于评定其能够区分不同类别的能力。通过增加指数运算改变了自适应调整的惩罚项权重公式,强化了惩罚效力,并对E-Wilcoxon惩罚Logistic回归算法的收敛性进行了分析。2.基于信用卡客户信用风险评估的实证背景,使用Python编码计算自适应惩罚权重的数值和算法模型,对特征变量进行了分析。选择准确率、精确率、召回率、F1-value、G-mean和ROC曲线下的面积AUC得分值共六个评价指标评估模型效果,对比分析了Logistic回归算法、Wilcoxon惩罚Logistic回归算法和E-Wilcoxon惩罚Logistic回归算法这三种模型的实验结果。综合评估发现Logistic回归算法预测效果不如惩罚Logistic回归算法,而且对于所有指标的数值,本文提出的E-Wilcoxon惩罚Logistic回归算法比改进前的Wilcoxon惩罚Logistic回归算法都高,上述六个指标分别提升了 6.17%、7.58%、2.81%、6.36%、5.19%和7.47%,能够说明改进后的算法优于改进前的算法。
其他文献
社区发现概念在众多领域都有所提及,同时它也是复杂网络研究中的一个重要分支,旨在发现复杂网络中的社区结构。由于社区结构在复杂网络上存在不确定性,网络具有多维性和模块性,联系强度的描述具有模糊性等多种原因,社区至今在学术领域还没有一个明确、统一的定义,但社区结构是客观真实存在的,反映了网络中的个体在一定范围内的行为特征,以及他们之间的联系。笼统的说,社区就是由相互之间连接密度比随机连接密度要高的一些节
学位
碰撞体算法是一种元启发式算法,其原理是基于物理中一维物体间的碰撞定律,主要指的是带有一定质量和速度的两个物体发生碰撞后,被分离并产生新的速度,移动到新的位置,对该过程不断循环,以此搜索全局最优解。由于碰撞体算法的结构简单,易于实现,不依赖于任何内部参数,所以被国内外的研究者们应用在科学设计和生产实践领域中。但是随着科学家们进行更为深入地调查和研究,发现碰撞体算法在搜索效率和收敛质量等方面有待加强。
学位
集体土地发展权的实现是解决集体以及农民土地收益和分配问题的关键,同时也有助于深化农村土地改革以及城乡统一建设用地市场的建立。本文以湖北省武汉市远城区为例,根据期权
农业产业集聚是实现农业现代化重要举措,是推动乡村振兴实施的重要抓手。蔬菜专业村是实现蔬菜产业专业化生产的重要载体,对推动蔬菜产业集聚发展具有重要作用。近年来,蔬菜
随着易于冶炼的黑钨精矿资源不断耗竭,钨提取理论和技术也随之不断完善。然而目前主流工艺如碱热球磨法、氢氧化钠压煮法、磷酸钠分解法以及磷酸钠焙烧法中均存在磷浓度过量
当今世界处于一个科技信息高速发展的新时代,教育也随着时代在进步,大学作为高等教育培养人才的摇篮,承担着十分重要的责任。大学图书馆作为大学的文献信息中心,在大学的教学
农业、农村和农民问题一直是我国农村改革与农业发展中的重大问题。2004年至2020年,中共中央连续17年通过中央一号文件的形式聚焦“三农”问题,由此可见国家对当前社会主义改
随着计算机技术的高速发展,高维度的数据不断积累,这些高维数据中存在着大量的冗余和无关特征,因此需要从大量的数据中提取出需要的信息,降维法是很重要提取数据的一种方法。降维法通过将高维数据减少或映射到低维空间来保存重要信息。降维常用的两种方法是特征选择和特征提取;特征选择是从原始的特征集合中挑选出使特征评价标准函数值最大的特征,并生成最优特征子集,是数据预处理的步骤之一,它可以去除数据中的噪声,节省数
学位
随着社会经济的飞速发展,能源过度消耗与环境污染加剧等现象已不容忽视,而众多应对资源环境问题的措施实质上是实施能源替代的具体体现。本文通过运用超越对数成本函数在似不
随着智能化时代的到来,信息过载问题越来越严重。搜索引擎通过用户输入指定的关键词来筛选出与之相关的信息,在一定程度上缓解了信息过载的问题,但是其它用户可能喜欢但与关键词不相关的信息并未被充分挖掘运用,个性化推荐系统因此诞生,协同过滤则是其中的主流技术之一。协同过滤算法不依赖于某一特定领域的专业知识,主要通过收集和分析大量关于用户以往行为的数据信息来产生推荐,不足之处则为存在冷启动,数据稀疏与扩展性差
学位