用户信用画像与信用评级的研究及应用

来源 :福州大学 | 被引量 : 0次 | 上传用户:randomx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着地球村概念的提出以及经济的发展,金融市场变得更加开放,我国经济正在逐步进入信用经济时代,在这个时代,信用消费已成为人们常用的一种消费方式。随着各类信用用户的增多,信用缺失、信用欺骗等问题逐渐显现,这说明我国信用体制还有待完善。为了避免上述问题的发生,分析用户的信用成为关键环节。本文主要研究用户信用体系中的用户画像和信用评级,主要工作可分为以下几个部分:第一,介绍了金融数据的不平衡性并研究了不同的重采样方法。在实际采集的信贷数据集中,通常情况下信用良好的用户比信用差的用户多,如果不加以处理会导致最终评级结果倾向于信用良好的用户。本文通过对比不同重采样方法在相同数据集上的表现以及同一个混合采样方法在不同数据集上的表现,验证了数据重采样的必要性,为后续信用评级提供良好的基础。第二,研究了金融信用体系中的用户信用画像问题,提出一种基于自组织映射神经网络(SOM)的改进k-means聚类算法。该聚类算法首先将处理好的数据输入到SOM神经网络中进行初步聚类,得到最终聚类个数和初步聚类结果,然后将聚类个数作为k值,每一类随机选取一个数据点作为k-means算法的初始聚类中心,最后得到每个用户的还款意愿和还款能力标签并对相关特征进行用户分析。第三,研究了金融信用体系中的信用评级问题,提出了一种基于层次模型融合的信用评级方法,在此方法中第一层使用极端随机树、随机森林和决策树作为基学习器,第二层采用了简单的逻辑回归学习器。为了验证融合模型的准确性,本文在同一数据集下比较了极端随机树、随机森林、决策树、XGBoost、BP神经网络和本文提出的融合模型的效果,结果表明本文提出的融合模型在用户信用评级问题上的准确率优于对比模型。在上述研究的基础上,本文设计并实现了一个可视化的用户信用评级系统。系统采用前后端分离模式,系统界面简洁、操作简单,使用已训练好的模型对用户进行信用评级,并且可以查看数据统计信息。
其他文献
复杂事物间的关联通常采用网络进行表示,随着网络规模的增长,事物的联系以大规模复杂网络的形式呈现出来,并行图计算就是将大规模复杂网络抽象成图再以并行的方式进行分析,通常采用图分区和图通信迭代技术。图分区是将图数据划分至不同的分区上;通信迭代的实现依赖于分布式图计算模型,在模型上执行图算法时需要多轮迭代,图上顶点之间会进行消息通信,是一种通信迭代过程。通信迭代时,每个顶点每次只传输一个消息的为单一的通
学位
多模态摘要旨在从文本、图像等不同的模态中精炼显著信息,并通过一种概括性描述来表示,近年来得到了国内外研究人员的广泛关注。目前的研究工作主要采用深度学习的方法,取得了瞩目的成果。但仍然存在一些问题:难以有效捕获图像中的关键目标特征;现有模型中需要优化的网络参数较多,导致训练时间较长;缺乏对图像内部噪声的屏蔽能力,导致模型难以准确刻画图像表示。本文针对上述问题展开研究,具体研究内容可分为以下三个方面:
学位
在纺织工业中,由于织机的机械故障、机器部件老旧、用于编织的纱线存在缺陷、布匹被过度拉伸或者表面存在褶皱等原因,加工出来的织物表面往往存在大大小小的瑕疵,严重影响到纺织工厂的生产效益。因此织物瑕疵检测成为纺织工业质量控制的重要环节。为了满足织物瑕疵检测模型需要具备高检测速度、高检测精度、低人工成本的实际需求,本文将深度学习方法应用到织物瑕疵检测领域中,研究并设计出适用于多种瑕疵类型与复杂纹理背景图像
学位
聚类算法是一种能将数据集中相似的点聚集起来的无监督学习算法。批量聚类算法虽然准确度较高,但不能有效利用上一次的聚类结果,每次运行都需要使用全部的数据集进行重新计算,导致资源浪费、耗时等问题。增量聚类指的是在新数据到达后,不必重新构建整个模型,只需要根据已经构建好的模型进行更新,这一特点非常适合于流式计算,但增量聚类算法准确度相对较低,并且无法满足流式数据需要实时处理的特点。流式聚类虽然能够实时处理
学位
信息技术的发展使得数据呈现高维化的趋势,而维度的增加会提升数据处理的难度,这一点在聚类分析中得以体现。由于高维数据的稀疏性和冗余性,许多传统的聚类算法在面对高维数据时会出现性能差的问题。为了解决这一问题,研究者们提出了许多新的聚类算法,子空间聚类(Subspace Clustering)就是其中比较有代表的技术之一。SubKMeans是一种基于K-Means的子空间聚类算法,其将原数据空间划分为一
学位
近几年雾霾天气频繁出现,给人们出行造成了极大的不便。雾霾天气下的场景能见度降低,进而导致一些成像设备获取的图像场景不清晰,不利于后续的场景内容分析。因此,图像去雾成为一个重要的研究方向,其旨在将有雾场景图像还原成无雾场景图像。本文围绕图像去雾这个主题,主要提出了三种基于深度学习的图像去雾算法。本文的主要研究内容如下:(1)提出了一种基于编码-解码结构的图像去雾算法。此算法首先使用三种不同卷积核大小
学位
机器阅读理解的目标是使机器具备理解自然语言文本的能力,已逐渐成为自然语言处理领域中的热点问题和重要研究方向之一。近年来,随着深度学习技术的兴起和大规模数据集的发布,该领域的相关研究取得了令人瞩目的进展。尽管如此,仍然存在诸多挑战如:以往方法中的问题-段落匹配结构难以准确刻画观点型问题中的语义关系;现有模型在多类型问题任务上尚不能很好解决答案类型多样化和数据不平衡带来的模型泛化性下降的问题;已有方法
学位
人体姿态估计,又称人体姿态识别,指对于给定人物图像或视频回归出人体关节点位置的过程。作为计算机视觉领域的热门研究课题之一,人体姿态估计在智能安防、人机交互、新零售、生物力学等多个领域有广泛应用。然而,当前人体姿态估计面临诸多难点。例如,视频背景复杂,人物相互遮挡,拍摄角度多变,光照强弱不均和人体姿态歧义等因素都会影响人体姿态估计准确度。现有的视频人体姿态估计模型主要利用光流或三维卷积网络来捕获视频
学位
近年来,随着医学信息的飞速发展,各种医学影像数据也越来越丰富,医学图像目标检测不断发展完善。针对腔镜甲状腺切除手术这一场景,甲状旁腺损伤可导致甲状腺患者术后终身的低钙血症,医生在腔镜手术时需要保障其不受到损伤。然而,甲状旁腺是很小的腺体,且在腔镜甲状腺切除手术中可能会出现充血和阻塞,这使得经验丰富的外科医生也很难识别它们。因此,通过计算机视觉中基于卷积神经网络的目标检测技术识别并定位甲状旁腺的位置
学位
现实世界中的复杂系统可以抽象为复杂网络,如蛋白质交互网络、科学家合作网络、文献引用网络等。复杂网络中的一大重要特征是社区结构,其含义为复杂网络中具有紧密内部连接的子图。在复杂网络中发现社区结构有助于揭示复杂网络的内在特性、了解复杂网络内部节点关系及演变趋势,为现实世界中的许多实际应用提供强有力支撑,因此社区发现逐渐成为复杂网络中的研究热点。然而,随着大数据技术的高速发展,复杂网络的规模呈指数倍数增
学位