论文部分内容阅读
链接分析是社会网络分析中非常重要的一类问题,关于社会网络的众多工作都是希望从网络中挖掘到更多的知识,包括节点的信息、链接的信息、网络社区的信息等等。链接分析则是对链接信息进行挖掘的一项工作。在社会网络中,节点构成链接,链接信息代表节点关系的语义,如是否存在,链接的强度,链接类型等语义。本文主要工作集中在链接预测和链接类型分类两类问题上。(1)链接预测是社会网络分析中一个具有挑战性的问题。社会网络中的链接预测问题就是预测社会实体间未被发现的链接和即将演化产生的链接。已有的链接预测算法大多基于社会网络本身的拓扑结构,而忽视社会实体自身的个性化特征,如用户实体的喜好,文本实体的主题内容等。为实现个性化链接预测,本文结合了社会实体的个性化特征和社会网络的拓扑特征,提出了一种基于概率矩阵分解模型的个性化链接预测算法。该算法整合了社会网络的拓扑特征和实体的个性化信息,建立概率矩阵分解模型,并通过基于梯度的优化算法对模型进行求解。实验结果表明了我们的算法较现有方法预测准确率有了较大提高。(2)链接分类旨在给定社会网络图谱,预测出其中链接的语义类型,如信任关系,同事朋友关系等。已有工作大多关注在特定领域,对特定领域的数据做人工特征工程,并且将人工特征用于分类器训练和预测。这种工作的局限是不容易扩展到其他社会网络中,算法框架缺少扩展性,在不同的网络上下文需要根据专家知识构造不同的特征。本文提出了结合矩阵分解和受限玻尔兹曼机的特征构造算法,可以根据网络拓扑自动构造隐式特征用于分类。在合作者网络和epinions信任网络中进行了实验,算法准确率较人工特征算法有了明显提高。综合两部分工作,我们提出了链接矩阵分解算法用于链接预测和基于受限玻尔兹曼机的特征提取算法用于分类,并且在真实数据集上证明了算法效果的提升。