结合关联规则与决策融合的个人征信模型研究

来源 :安徽工程大学 | 被引量 : 0次 | 上传用户:hongjiansu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络贷款、消费金融等行业的快速发展,个人信贷行业展现出无限的活力与潜力。为了保障信贷业务健康发展,维护金融稳定,如何准确、高效地评估个人信用等级成为亟待解决的问题。关联规则用于发现大量数据项集之间的关联关系或相关关系,而决策融合是最高层次的信息融合,具有良好的实时性和容错性。因此,本文基于关联规则与决策融合的理论构建了以下三种个人征信模型:(1)构建了融合多视角相似测度的个人征信模型。某一信用等级下征信属性可以看作是服从某一分布的随机向量。因此,本文将征信的属性作为一个整体来考虑,在相同信用等级的征信属性分布具有相同均值的假设下,选择HotellingT2统计量来度量客户信用的相似性;从随机向量每个分量的边缘分布角度,选择以信息论为基础的信息测度Jensen-Shannon差异来度量客户信用的异同;当将客户信用属性项值视为高维数据空间的向量时,选择基于向量间夹角的Cosine距离来度量客户信用的差异;最终,利用加权投票策略来融合三个视角下最近邻分类器的决策信息。(2)构建了结合关联规则与自适应加权决策融合的个人征信模型。基于Apriori的关联规则挖掘是依据给定的测度(支持度、置信度或加权卡方),在数据集中通过挖掘频繁项集进而获取强关联规则的过程。但是,不同的属性项、测度以及规则对信用评价的鉴别能力是不同的。因此,本文利用后验概率设置揭示属性项判别能力的权重,通过分类性能设置体现三种测度评估信用贡献度的权重,借助学习的阈值设置反映规则信用评估能力的权重。进而,挖掘出相较于传统关联规则更能提升信用评估性能的属性项、频繁项集和分类规则,互补了不同测度的不足。最终,利用加权投票策略来融合分类规则的决策信息。(3)构建了融合多视角相似测度与关联规则的个人征信模型。除了从分布的参数假设检验、分布所含信息量以及向量的方向三个方面来揭示客户信用的差异外,也可以将征信属性值看做向量空间中的点,通过向量空间中一致范数所衍生的度量——Chebyshev距离量化客户信用风险的相似性;以及当征信属性值进行二值编码后,通过等长字符串间Hamming距离来表示客户信用的相似度。但是对于高维数据,Chebyshev距离、Hamming距离以及Cosine距离因“维数灾难”性能退化。因此本文利用关联规则提取重要频繁属性项集,以达到提高Chebyshev距离、Hamming距离以及Cosine距离的鉴别客户信用风险性能的目的。最终,利用加权投票策略来融合五种相似测度的决策信息。
其他文献
介 绍了一种新型的安全闸板提升装置,详细说明了设备开发改造的具体内容及其重要意义,并将该设备投产使用,解决了生产中的实际问题,取得了良好的经济效果.
面对经济增速放缓、结构升级、动力转换的新发展阶段,合肥亟需以"数字革命"为契机,加快推进5G基站和数据中心建设,为数字经济发展提供基础设施体系;充分汇聚和挖掘数据价值,
水土化验工作是水利科研试验工作的基础,试验研究所需要的基本数据许多都要通过水土化验来分析判断.找出规律性的东西,指导生产实践,本文结合作者多年的工作实践对水溶性盐分析中
思路教学是现代教学的重要途径,传统教学中,思路教学只是作用于教师单方面,因此往往形成照本宣科,满堂灌的教学模式。要想使政治课适应社会主义现代化建设的需要,培养高素质
BIM技术以其强大的信息整合优势广泛的应用于建筑的全过程实施中。而BIM技术在应用过程中存在项目协同管理整合度低,企业之间数据类型复杂多样,信息集成与共享程度低等问题也
列子,上承老子下启庄子,是先秦道家的代表人物之一。《列子》一书是我国古代体现道家思想和中原传统文化精神的重要文献典籍,在中国思想史以及文化史上有着非常重要的地位。
煤液化减压阀的工作条件非常苛刻,对其阀座、阀芯等关键部件在高温、高压差、高固态浓度流体冲蚀条件下的抗冲蚀磨损性能及使用稳定性提出了极高的要求。CVD金刚石涂层具有接
成都农业科技职业学院园林工程技术专业结合自身实际情况,通过实践,大胆尝试了"工学结合"的高等职业教育实用型人才培养模式,得出采用的工学结合模式是顺应社会需要和人才需求
介绍恒线速度磨削设备PLC电气控制系统,设计设备的机架及测量结构,编写系统控制软件,选择欧姆龙CP1H-200Y型可编程控制器、激光位移传感器等实现磨削自动控制,对设备可靠性进
自20世纪80年代以来,语篇逐渐出现在对外汉语教学研究的视野中,经历了近四十年的研究探索与教学实践,2010年对外汉语语篇教学研究出现新动向。文章首先利用数据统计对对外汉