论文部分内容阅读
链路预测是社交网络研究中最核心、最本质的研究问题。文章基于学术合作关系社交网络,采用多种现有的经典机器学习算法进行链路预测。针对现有监督学习算法中特征集使用不够全面的问题,抽取了三大类别的特征。针对数据高度偏斜问题,采用了欠采样的方式使模型不对主要类别过度偏斜,以此保证分类器的有效性。实验结果表明,Adaboost和多层前馈神经网络模型在精确率、召回率以及F1-measure指标上优于其他监督学习方法,而朴素贝叶斯方法在本问题上表现最差。