论文部分内容阅读
随着互联网金融的迅猛发展,金融领域的相关业务对信息技术有越来越多的利用,但也造成了很多安全问题,如洗钱犯罪。基于资金交易的洗钱团伙,或是通过掩盖非法所得,将腐败资金转移境外,导致社会财富外流,或是为其他违法犯罪集团提供资金,助长违法犯罪,诸如此类的行为,严重危害到金融安全,动摇社会信用、破坏社会稳定。如何通过资金交易数据从庞大的客户群体中识别出可疑犯罪团伙,已成为国内外专家的研究重点。针对金融领域洗钱犯罪团伙识别的研究,主要分为两部分。一是基于资金交易特征建立犯罪团伙模型,二是利用社区发现识别可疑犯罪团伙。然而现阶段建模的研究主要依靠对银行等金融机构给出的可疑交易报告,没有充分利用金融交易的大数据;利用社区发现技术进行基于资金交易的犯罪团伙识别又存在算法复杂度过高,运行效率慢的问题。本文针对这些不足,对基于资金交易的犯罪团伙识别进行了深入研究。具体工作包括:(1)针对人工分析报告的不足,收集大量的金融交易数据,将不同客户间资金交易的关系,包括资金交易的数额和频率、资金交易的路径等进行特征提取和原始数据预筛除,并主要针对资金交易的数额和频率属性,提出了一种新的资金交易权值计算方式。(2)针对基于模块度的Louvain-Method社区发现算法在效率方面的问题提出了并行化优化方案,在保持原有算法的高准确性的基础上提升了算法的运行速度。在实施Louvain-Method算法并行化优化的过程中,本文运用基于图着色的分割算法和虚节点的思想解决了图划分过程中造成的节点间信息丢失的问题,对于本地移动过程中产生的“社区互换”、“描述滞后”的问题,也给出了相应的解决方案。(3)根据提出的新的权值计算方式和改进的基于模块度Louvain-Method 社区发现算法,实现了一个基于资金交易的金融网络犯罪团伙识别系统,该系统搭建在hadoop分布式集群上,应用MapReduce编程模型,在实际场景对大规模复杂金融交易网络数据集进行测试验证,对实验过程的速度和准确性做出定量分析比对,证明本文论述的基于资金交易的金融网络犯罪团伙识别方案具有更好的有效性和准确性。