论文部分内容阅读
在线社交网络已经成人们工作生活中不可或缺的一部分,人们每天社交活动所产生的海量数据蕴含了大量的个人信息。社交网络分析包括用户关系预测、社团发现、社会影响力分析、社交信息传播等,是当前的重要研究方向,部分研究结果已经应用在疾病传播控制、犯罪侦查、产品推广等领域。用户关系是社交网络形成和发展最基本的组成部分,也是用户信息分享和交互的基本通道,是社交网络分析的重要依据。社交网络用户关系分析是指根据已有的部分社会网络结构、用户属性和行为等信息,分析用户之间的亲密程度并预测用户之间是否存在关系,是社交网络分析的一个基本问题。现有的社交网络用户关系分析方法主要是依据社交网络拓扑结构,预测好友关系,如基于好友关系和路径的分析方法,主要依据社会学观点:两个用户之间的共同好友越多或连接路径越短,则意味着他们成为好友的概率越高,提出了基于共同好友和连接路径的用户关系分析方法。有的工作还借助用户属性信息进行用户关系分析和预测,或是将拓扑结构和用户属性进行结合分析用户关系,以解决用户属性信息不能完全真实可靠的问题。整体上,现有工作主要存在三个方面的不足:没有考虑社交行为对用户关系的动态影响;缺乏用户关系的个性化需求分析及对关系预测的影响;仅针对社交网络的直观可见的数据进行分析,缺乏对于影响用户社交关系的隐含因素的深度分析。针对这些问题,本文将整合社交网络中拓扑结构、属性及行为等多模态数据,以提高用户关系预测的准确性,本文主要贡献如下:针对复杂社交行为建模与特征提取问题,本文提出了潜在因素这一概念用来衡量用户社交意图和社会行为之间的内在联系。通过对潜在因素的提取和分析,给出了基于用户行为的用户关系度量方法。提出了基于用户交友偏好的属性建模方法。通过分析用户已知好友的属性取值,得出个性化交友偏好,本文对用户的每个属性取值进行个性化分析,提出了基于比例和信息熵的属性重要度计算方法,同时考虑双方共同的交友意愿,给出了基于属性的用户关系度量方法。针对用户关系度量方法的融合问题,提出了松散融合和紧密融合两种方式将不同的用户关系度量方法进行融合,松散融合是将每种度量方法看作是相互独立的,将他们赋予不同的权值进行直接的融合,而紧密融合是将属性或者行为度量标准融合到已有的网络结构度量标准之中。最后在两个真实的社交网络数据集中进行了实验,实验结果显示我们的方法准确率要高于以往的用户关系预测方法。