论文部分内容阅读
在社交网络中,存在着大量的节点信息,同时又存在着数量更为巨大的节点间的联系。由此基于社交网络的分析和挖掘成为一个热点研究内容,并从社交网络中发现了更多有价值的信息和知识。
校友关系网络作为社会网络的一个应用,在校园的校友检索等应用中,占有重要的地位。但是在校友关系网络建立的过程中经常存在着大量的信息缺失。对校友关系网络中的节点属性进行预测是本文的主要工作。
本文首先列举了几种对社交网络中节点属性信息补充的方法,分析了每种方法对数据的要求以及在社交网络中节点属性预测应用中的局限。然后使用BSP聚类方法在较为完整的校友数据上完成了初步的验证实验。经分析,虽然BSP聚类方法能支持网络数据,但是不能直接对节点的属性完成预测,需要通过规则的方法完成预测。
本文应用社交网络的分类框架,在标注数据少,关系类型不明确的校友网络上实验。本文实验引入互联网搜索结果,结合社交网络中的信息,根据定义的两套规则抽取特征,实现校友学院信息的预测。为进一步提高标注数据在社交网络中的贡献,提出了基于社交网络分类框架的半监督改进,提高了实验效果,降低了校友网络分类对节点信息的敏感度。最后,给出了本文算法的复杂度,分析了本文方法在并行运算中的可行性。