论文部分内容阅读
随着民航旅客的爆发式增长,航空公司旅客数据呈现出海量性和复杂性的特点。复杂网络因其具有揭露复杂系统本质、发现隐性规律和预测网络演化的特性而得到广泛应用。本文基于复杂网络挖掘民航旅客重叠社区结构,对航空公司制定收益提升营销策略具有重要的实际应用价值。提出一种基于生成对抗网络的民航旅客关系识别模型(CAPR-RM),主要针对民航旅客关系网络构建中旅客关系识别召回率低的问题。首先,进行数据融合处理,提取旅客之间的共同出行特征。其次,设计改进生成对抗网络优化其稳定性,利用确定具有真实旅客关系的样本数据对模型进行训练,通过训练完成的可以生成拟合真实旅客关系特征分布的生成网络处理待识别旅客关系数据。最后,依据判别函数计算处理后的待识别旅客关系数据与原数据的距离来对旅客关系进行识别。在真实旅客服务数据集上的实验结果表明,CAPR-RM模型的识别准确率、召回率和F1值均达到90%以上,本文模型具有较高的召回率和识别精度。提出一种引入成对约束的多标签传播重叠社区发现方法(PCMLPA),主要针对传统标签传播算法存在鲁棒性差和准确性低的问题。首先,融入显性、隐性双层旅客关系构建民航旅客关系网络。其次,结合民航旅客关系网络中成对约束获取成本低和约束扩展的特点,引入半监督思想并设计重叠社区中的约束扩展规则,提高社区检测结果准确性的同时提高约束的利用效率。最后,优化标签传播过程中节点更新和遍历的顺序,增强算法的鲁棒性。在人工合成网络和真实网络数据集上的实验结果表明,PCMLPA方法具有较优的鲁棒性和时间复杂度,在社区检测结果的准确性方面,本文方法引入约束量级5%的情况下相比其它算法平均提升13.46%,显著优于其它重叠社区发现算法。