基于改进SMOTE算法的金融反欺诈模型

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lzy19900924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技发展,传统金融行业寻求转型,与互联网行业融合,利用互联网行业的信息科技构建互联网金融平台等新型金融业务模式.金融行业借助互联网平台获取用户各类信息,为其金融业务提供便利.其中金融借贷业务也借助金融科技构建金融反欺诈模型,用于预测贷款用户违约的可能性,帮助金融行业规避欺诈用户,保护资金安全.然而金融反欺诈模型的建立面临很多挑战,普遍涉及数据量大、特征繁杂和数据集类别不平衡等问题,其中类别不平衡的问题是现阶段金融反欺诈模型面临的重要难题之一.由于传统分类算法对多数类样本识别率高,对少数类样本的识别率却不理想,导致了虽然分类算法识别的精确率较高,但算法的召回率却较低的情况.在金融反欺诈问题中,具体体现不能有效识别出存在坏账风险的用户.为解决金融反欺诈模型中信贷数据存在的数据不平衡的问题,提出了一种有效的过采样算法MSBDSMOTE算法.该算法基于经典聚类算法Meanshift算法与Borderline-SMOTE过采样算法结合.算法首先使用Meanshift算法对所有样本进行聚类,将少数类样本较多但密度较为稀疏的簇作为过采样的安全簇;然后,计算各个安全簇内少数类样本的过采样权重;最后使用Borderline-SMOTE过采样算法在各个簇内进行过采样,根据计算出的过采样权重合成人工样本.该算法对比传统SMOTE算法优化了边界样本误识别和合成的新样本高度相似问题,提高了人工合成样本的多样性.同时该算法考虑了簇内和簇间的样本分布不平衡的问题,使得合成样本更加合理.同时为验证该算法的可行性,本文选取了三个真实的金融信贷数据进行仿真实验,并运用现下流行的经典过采样算法进行对比实验,在KNN、随机森林和XGBoost分类器下对比实验结果,结果表明MS-BDSMOTE算法可有效提高模型对不平衡数据集分类性能且优于现下流行的传统过采样算法.
其他文献
随着全世界在人工智能及物联网等方面的快速发展,作为电子产品的制造大国,中国当下也在积极的发展半导体产业。众所周知,半导体芯片在加工制造过程中离不开特种气体及化学品的协助作用,为了到达气体化学品的持续稳定供应目标,将精益生产理论纳入到半导体工厂气化生产系统的管理研究中,以提高半导体工厂气化生产系统的整体管理水平,提高效率,消除浪费就显得至关重要了。本文以Y半导体工厂的气化生产系统为对象,研究精益生产
学位
当今植保无人机飞防服务势头正劲,载着药罐的无人机已经得到了广泛认可,但与此同时,农用无人机的另一个潜在应用——农业遥感也不容忽视。遥感被认为是农用无人机的另一个潜在市场,随着精准农业步伐的不断加快,代表着农用无人机的另一个广阔未来。无人机对农业的好处越来越明显,从绘图、测量,再到作物喷洒,它在农业上的应用范围也越发广泛。无人机遥感技术,具备很多传统测绘技术不具备的优势,其存在的问题也在逐渐改进,随
期刊
在信息时代,图片承载着大量的信息,已成为继文字之后又一个重要的网络信息载体,存在非常重要的作用。对于用户来说,如何能在较少的时间内找到需要的图像信息成为一个问题。在过去的几年中,研究者使用机器学习和深度学习技术对图像分类进行了大量研究,不同的模型对不同的问题有不同的效果。总的来说,在图像分类过程中主要存在两方面问题:一方面是图像特征提取,特征提取方法以及提取的特征质量将直接影响分类性能。传统的图像
学位
随着人类社会的进步与发展,广泛存在的合作行为成为了生物、经济以及社会学等领域的研究学者十分重视的问题.其中,慈善捐赠现象更是引起了社会的广泛讨论,它不仅是一种具有合作性质的社会行为,也是对国家“共同富裕”政策的积极响应.个人慈善捐赠作为其中的一种形式,为我国慈善事业的发展奠定了坚实基础,注入了不竭动力.但是,在近几年中也出现了例如人均慈善捐款额度较低,国民捐助行为的普及性和积极性还有待提高等问题,
学位
新发展格局下,我国的资本市场发展迅速,2020年沪深两市成交额突破206万亿,同比增长逾6成,市场主体数量不断增加的同时,投资者对于投资的风险愈加看重。配对交易作为中性交易策略,具有投资风险较低、收益稳定的良好特性。随着我国做空市场机制的日益健全,配对交易得到的关注与日俱增,越来越多的学者参与到对传统配对交易模式的改进与优化当中。配对交易一般采用一对一的股票配对构建交易过程,往往套利机会较少,配对
学位
就业率犹如高校教育质量的晴雨表,面对地产行业下行的压力,曾经如雨后春笋般蓬勃发展的环境设计专业,如今面临着多方困境。文章从业态环境与就业市场人才供需调研入手,一方面围绕人才培养方案,对通才教育体系下的课程与教学结构进行优化与改进,另一方面通过工作室制度整合,强化优才选拔与核心就业能力养成,从专业教学与应用实训双维度,对就业能力成长体系的建设与改革方案展开论述。
期刊
森林能将有害的二氧化碳吸收,释放大量的氧气,对生态碳循环、全球生态气候有着重要作用。文章对森林经营管理中提高森林碳汇能力的有效策略展开了分析。
期刊
<正>据中国政府网2023年2月27日消息,日前中共中央、国务院印发《数字中国建设整体布局规划》,要求各地区各部门结合实际认真贯彻落实。《规划》提出:“到2025年,基本形成横向打通、纵向贯通、协调有力的一体化推进格局,数字中国建设取得重要进展。”“到2035年,数字化发展水平进入世界前列,数字中国建设取得重大成就。”
期刊
投资组合优化是从所有投资组合中选择最佳投资组合的过程,该过程的目标是使收益最大化和风险最小化之间达到平衡。作为投资者,有两个决策目标:一是在给定的风险下获得尽可能高的收益;二是在预期收益下获得尽可能低的风险。在投资组合理论中,最典型的就是Markowitz的均值方差模型,但因其依赖于特殊概率分布并对参数高度敏感,参数的细微变动可能使决策结果产生很大的变化。所以,可有效处理参数不确定性问题的鲁棒优化
学位
共享单车作为一种新型公共交通模式已经被广泛接受和使用,极速发展的共享单车系统满足了城市居民短距离出行的需要的同时也减轻了大型城市交通系统的拥堵负担。而随着无桩共享单车的模式产生和急速发展,极大地扩展了共享单车的应用场景。因此在许多公共交通系统完善,尤其是在地铁系统发达的大型城市,往往会产生大量的短途交通需求,共享单车通常会作为传统公共交通系统的延伸,解决家、公司、商城等和地铁站之间的短距离出行问题
学位