论文部分内容阅读
随着现代客运行业的发展与人们生活水平的不断提升,人们出行的次数越来越多。并且人们出行的时候有时会与他人结伴同行或是一起组团出行,比如与人一起出差、与好朋友一起旅游等,由旅客个体之间的这种同行关系建立起了一张旅客的同行关系网络。对这个网络中新出现的链接进行预测,不仅可以为客运行业的个性化服务奠定坚实的数据基础,进而提高客运服务质量,还可以用于支持客运行业市场的决策。预测旅客之间新产生的同行关系本质上是一个复杂网络中的链接预测问题,而复杂网络的链接预测一直是广大学者关注的热点问题,它在各个领域都有着广泛的应用。本文针对旅客出行的基础数据以及旅客同行网络,构建了一个基于监督学习的同行关系预测模型。该模型构造了三种类型的预测特征,分别是个体信息与历史行为特征、网络微观特征和网络中观特征。其中,旅客个体信息与历史行为特征由旅客的个体信息以及旅客的历史出行信息抽取得到;网络微观特征包含网络共同邻居特征和网络邻居子网特征,我们将已有的预测指标归类为网络微观共同邻居特征,并在此基础上构造出了网络微观邻居子网特征;网络中观特征由节点的层次社区信息提取,我们首先使用层次社区划分算法对网络进行层次社区划分,然后根据共同邻居的社区信息来构造出一系列层次社区属性。这种定义使得网络方面的特征更加丰富。最后我们运用这三种类型的特征,使用分类方法来进行链接预测。本文在一个真实的旅客出行记录数据集上进行了实验,并分别比较了在随机样本集和限制旅客对在网络中的距离为两跳的样本集下的实验效果,结果表明我们设计的旅客个体信息与历史行为特征、扩展的网络邻居子网特征以及网络中观层次社区特征在旅客同行网络上链接预测中表现良好。并且,将三种类型的特征用在随机样本上预测时,可以使得准确性能达到92%以上,充分体现出了我们所构造的特征与建立的预测模型的有效性。