论文部分内容阅读
文章根据Kaggle平台提供的客户贷款数据,进行数据清洗、变量相关性分析、特征缩放等操作,建立Logistic回归模型,并针对样本类别不平衡问题运用SMOTE算法进行过采样,最后以5折交叉验证及AUC为依据对模型性能进行评估。实验结果表明:SMOTE-Logistic回归算法在银行个贷违约预测应用方面有良好表现,且优于KNN算法及随机森林算法。