论文部分内容阅读
金融欺诈是一种采用非法手段获取经济利益的行为。金融欺诈风险严重损害了资本市场的运行效率和稳定性,对经济市场造成了剧烈冲击。新一代信息技术通过赋能传统金融行业,使其逐步向数字金融转型。然而,数字金融欺诈手段不断升级,频繁交易的金融数据表现出高维、复杂和非线性等特点,为欺诈风险防范带来了新的挑战。传统的反欺诈手段维度单一,计算效率低下,难以有效服务日益下沉的用户群体。因此,金融市场亟需运用智能风险预测技术,助力提升数字金融欺诈风险识别能力,对欺诈风险进行智能化、主动化和精准化预测。面向数字金融欺诈的智能风险预测方法,旨在从大规模数据中挖掘其蕴含的规律和知识,对数字金融欺诈风险进行准确、有效地预测。首先,为了从交易量大且数据密度低的场景中提取对数字金融欺诈风险预测有价值的信息,研究了数字金融浅层特征选择关键技术;其次,为了解决数字金融欺诈样本不均衡场景下采用单分类模型预测性能不稳定的问题,研究了集成预测模型构建的关键技术;此外,为了深入分析数字金融历史交易对当前及未来的结果产生的重要影响,研究了深层时序预测模型构建关键技术,挖掘欺诈交易数据中复杂时序相关性;最后,为了挖掘欺诈交易与交易之间的图结构特征,并融合数字金融欺诈时空特征,研究了深层时空预测模型构建的关键技术。本文的主要研究内容和创新点如下:(1)研究面向数字金融欺诈的浅层特征选择方法。针对数字金融欺诈数据中存在冗余、不相关特征的问题,提出融合改进萤火虫算法、多重分形(Multifractual dimension,MFD)、Probit回归和人工先验知识的浅层特征选择方法。先将MFD用作特征子集的评估准则,采用改进萤火虫算法作为搜索策略,初步选择数字金融欺诈风险特征子集;再结合数字金融欺诈背景和领域知识,运用Probit模型剔除初步特征子集中与数字金融欺诈风险非显著相关的因素,并将其与人工先验知识选择出的特征结合,选择数字金融欺诈风险关键特征子集,为后续预测提供高质量的数据基础。(2)研究基于浅层特征的数字金融欺诈风险选择性集成预测方法。针对数字金融欺诈风险预测常用的单分类器性能不稳定的缺陷,提出基于信息交互萤火虫算法和差异性测度的选择性集成预测方法。首先,设计基于双错测度的预选择集成模型,运用Bootstrap方法独立重复抽取训练集,并训练获得多个具有较大差异性的基分类器,构建基分类池;再计算每个基分类器的双错测度,并按照测度大小进行升序排序;最后采用多数投票法,根据测度顺序将基分类器逐个累加集成,直至集成精度最优,并从理论角度分析了方法的有效性。其次,为了平衡基分类器之间的精度与差异性,提出融合信息交互萤火虫算法(Information Exchange Glowworm Swarm Optimization,IEGSO)和差异性测度的数字金融欺诈选择性集成预测方法,先采用差异性测度对基分类池进行预选择,再使用IEGSO对预选择后剩下的基分类器进行二次选择;最后获得最优子集成,并将其用于解决数字金融欺诈风险预测的实际问题。(3)研究面向数字金融欺诈风险的深层时序预测方法。针对数字金融欺诈复杂时序特征提取问题,研究基于深度学习的深层时序特征挖掘方法,对数字金融欺诈风险进行时序预测,提出基于动态进化萤火虫算法和长短期记忆(Long Short-Term Memory,LSTM)模型的数字金融欺诈时序预测方法。先引入动态进化机制和定向变异机制,提出动态进化萤火虫算法(Dynamic Evolutionary Glowworm Swarm Optimization,DEGSO),提升算法搜索性能;再采用DEGSO优化LSTM模型的主要参数,获得LSTM模型的最佳参数组合,有效学习数字金融欺诈数据中的时间相关性,提高预测的准确性。(4)研究面向数字金融欺诈风险的深层时空预测方法。将在时序特征提取方面表现突出的LSTM与在空间特征抽取方面表现良好的图卷积神经网络(Graph Convolutional Neural Network,GCN)进行融合,提出基于GCN和LSTM的数字金融欺诈混合时空预测方法。先采用GCN提取不同交易之间的空间相关性,再使用LSTM学习金融交易数据中的时间相关性,最后融合数字金融欺诈数据中蕴含的深层时空特征,并进行欺诈风险时空预测,提升欺诈风险预测的有效性和显著性。本文系统研究了面向数字金融欺诈的智能风险预测中的关键问题和关键技术,研究成果对构建高效、准确的数字金融欺诈风险预测模型具有重要的理论意义,同时为金融从业者的投资决策提供技术支持,对维护金融稳定与安全具有重要现实意义。