论文部分内容阅读
旅客同行关系作为一种特殊的社交关系在民航领域有着重要的研究意义与应用前景。民航旅客同行关系网络预测旨在对由民航旅客为节点,旅客共同出行关系为边的同构网络进行链接预测。对于机场,挖掘旅客的同行关系可以精进机场的黑白分级安检环节,这将大大提高机场整体的运行效率;对于航空公司来说,构建完整的旅客同行网络,可以针对旅客精准的进行航线推荐。而对于旅客本身来说,对旅客同行关系网络的预测也可以极大保障旅客的人身安全。由于民航旅客同行网络中旅客节点数量庞大但边极为稀少,使得网络具有高度稀疏的特点,而现有社交网络链接预测方法多数是基于相似度算法来对稠密图节点之间的关系强度分析并预测,因此不适用于高度稀疏的民航旅客同行网络链接预测。因此本文首先提出在海量的民航旅客订座记录的基础上,将有限的散列字段转换为网络数据,构建旅客同行关系网络。接着在该网络数据中深入挖掘旅客对之间的关系特征并进行提取以及细化,将提取后的旅客同行关系特征进行特征向量化,生成特征矩阵作为分类器的训练数据,并在四种不同的分类器下均取得了较好的预测结果,证明了提取后的旅客同行关系特征属性具有良好的有效性及适用性。在旅客同行关系特征获取的基础上,本文进一步研究了动态旅客同行网络链接预测。对于随时间而变化的同行网络内部的关系预测,将其称之为旅客同行网络未来链接预测。本文为此使用五种中心性指标对样本数据进行中心性分析,并在旅客同行关系特征属性的基础上增加提取了旅客同行网络共同邻居拓扑特征和旅客同行网络分层社区特征作为三类特征属性,基于时间窗的概念上在某一时间段内提取该三类特征作为观察窗口,并将下一时间段作为预测窗口建立预测模型进行同行关系网络的未来链接预测。实验证明,对于三种特征属性分别的表现,均对同行网络预测结果产生不同程度的积极影响,而三种特征属性组合形成的预测模型的预测结果表现良好,进一步证明了本文对三种特征属性提取的合理性及适用性。