论文部分内容阅读
近年来,随着互联网技术,特别是移动互联网的快速发展带来了更高层次的信息化时代,随着基于网络的金融交易如电子支付、移动支付发展的同时,也带来了更为严峻的金融交易安全问题。为防止违法金融行为带来经济损失,有必要研究基于大数据的网络金融交易异常检测技术,通过研究异常检测算法在网络金融交易领域的应用,以准确识别网络金融交易中存在的异常交易情况,及时阻止违法金融行为。到目前为止,尽管已经提出了许多种异常检测算法,但是在网络金融交易的实际应用中仍然面临着不少问题,例如计算复杂度较高、结果准确率较低以及算法稳定性等方面都没有得到很好的解决或平衡。在进行基于大数据的网络金融交易异常检测时,现有的基于模型的异常检测技术、基于距离或基于密度的邻近性异常检测技术在解决高维交易数据的维度灾难问题,数据稀疏性以及海量数据方面,还存在不足之处。本文正是从这些方面出发开展研究,针对已有的解决高维空间维度灾难问题的基于角度的异常检测方法进行了改进,提出基于数据中心的角度异常检测方法来进行大数据量的网络金融交易数据异常检测。将基于角度分布的思想运用到高维数据的离群点检测中,通过减少角度方差计算中边的选取,加快了算法的运算速度,降低了算法对时间和物理存储的需求。针对海量高维数据下已有的异常检测算法存在复杂数据集合检测效果误判率较高,运算时间难以承受的问题,受到基于局部距离的异常检测算法以及单次抽样算法的启发,提出了一种改进的基于单次密度偏倚抽样的局部距离异常检测算法。通过利用基于密度偏倚抽样和局部距离异常系数,对抽样得到的子集合进行异常系数的计算,从而识别异常点,通过基于密度偏倚的抽样以达到算法效率优化的目的。