论文部分内容阅读
近年随着移动设备的普及、移动互联网的快速发展,促使了数据急速增长,催生了互联网金融等新兴行业的快速发展,在这样的背景下,传统金融行业受到了互联网金融行业的剧烈冲击。数据的急速增长是一把“双刃剑”,给企业带了更多管理成本的同时,也蕴藏着更有价值的信息。用户流失预测问题是银行业务中讨论最多的几个问题之一,探索适合现有数据环境的用户流失预测模型,对银行业务的开展具有重要意义。本文在分析研究了某城市商业银行用户的历史存贷、交易统计以及征信等信息后,进行了数据预处理和特征选择等工作,得到了模型的输入特征。在104224位用户的预测实验中,先使用CART分类树和随机森林两种传统机器学习模型进行模拟实验,CART分类树的精确度为55.05%,随机森林的精确度为63.17%,在实际生产中应用价值较低。为了改善模拟效果,探索深度学习模型在此数据集的应用,提出的四种深度学习模型实验结果精确度都达到了87%以上。其中将RNNs与CNNs并行方式集成的BLSTM-CNN模型,很好解决了RNNs与CNNs单独模拟的缺陷问题,并很好解决了DLCNN模型LSTM层输出结果在输入到卷积层时会忽略部分局部信息的问题,实验精度精确度达到了95.33%;并在此过程中提出一种将二维特征数据重构为三维特征数据的方法,构造了二维数据动态特征,增加模型的输入特征;之后在BLSTM-CNN模型的基础上引入注意力机制,提出Attn BLSTM-CNN模型,相较于BLSTM-CNN精确度提高了0.2%,进一步改善了模型的效果。最后根据Attn BLSTM-CNN模型,给出了在实际生产中,从数据处理到模型训练,最后得到预测结果的应用流程。