论文部分内容阅读
商业银行拥有的海量客户交易数据,其中蕴含着许多潜在的规律,充分挖掘并利用这些规律可以在更高程度上提升商业银行的管理水平与业务竞争力。复杂网络是研究诸如银行客户交易系统等复杂系统的一种有效建模手段,同时它还普遍存在着社区结构特性。社区结构为复杂网络的研究提供了可行的切入点,可以充分利用社区这一特点研究网络的拓扑结构及其动力学行为,进而有效挖掘复杂系统中潜在的规律。模块度优化方法是复杂网络社区发现的主流方法之一。鲁汶算法是较优秀的无向网络的模块度优化算法,但其依然存在不足。首先该算法需要频繁地计算无向网络中节点离开原属社区后模块度的增益,但是现有研究中没有可直接计算该类增益的公式;其次与其他相近算法相比,它对存储空间的需求较高。相比无向网络社区发现的研究,研究领域中针对有向网络社区发现的研究涉及较少,目前较可行的方法是以有向网络的模块度为目标函数,借鉴无向网络模块度优化算法的思想,设计相应的有向网络的模块度优化算法。但是现有的该类算法大都时间复杂度较高,而且它们的社区发现结果质量也不理想。论文依据某商业银行的真实客户交易数据构建了5个客户交易网络,然后针对鲁汶算法的不足提出了改进同时还设计了一个有向网络社区发现算法,最后甄别得到了5个银行客户交易网络的社区结构并分析了它们之间的异同。论文完成的主要工作如下:(1)设计实现了集成多种改进策略的鲁汶算法。首先推导出了无向网络中节点离开原属社区后模块度增益的计算公式,并将其应用在鲁汶算法中,使得算法中每个节点的社区归属多一种情形;然后针对鲁汶算法对存储空间需求高的缺点,提出了分离孤立节点的改进策略;最后引入提纯改进策略以进一步提升算法社区发现结果的精度。基于真实网络的相关实验表明,本文的改进策略不仅使算法对存储空间的需求大幅减少,而且可让算法的运行时间更短且社区发现结果的精度更高。(2)设计实现了基于鲁汶算法思想的有向网络社区发现算法。首先推导出了有向网络的模块度基于社区连接矩阵的定义,进而得到了有向网络中节点合并后模块度增益的计算公式以及节点离开原属社区后模块度增益的计算公式,最后借鉴鲁汶算法的思想设计了一个有向网络社区发现算法。基于真实网络的相关实验表明,与现有的有向网络的模块度优化算法相比,该算法在运行时间以及社区发现结果的精度方面都具有明显的优势。(3)利用(1)、(2)中的算法甄别得到了5个银行客户网络的社区结构,并提出了一种新的模块度以比较5个网络社区性质的优劣,最后集中分析并可视化展示了各网络的社区结构及它们之间的异同。