论文部分内容阅读
移动互联网的快速发展,使得社交服务平台的普及率越来越高,服务内容也已经延伸到了生活中的方方面面,社交网络不仅仅是现实社会在网络上的延伸,也是与现实社会既紧密交织又平行独立的的新型社交模式。社交网络已经成为寻找朋友扩展社交圈的重要途径,而平台服务商如何为用户推荐更适合的好友提升用户体验,就是如何提高链接预测准确率的问题,也是本文的主要研究问题。同时,已有学者在对人格特质的研究中,证明了人格可以被用于预测用户的行为,包括学业成就、健康状况和社交网络行为等,那么人格是否也会影响社交网络中的链接关系,是否可以将人格作为链接预测的一个依据,这也是本文研究的一个问题。针对以上问题,本文以提高有向社交网络中的链接预测准确率为主要目标,先通过社交平台数据预测出用户的人格特质得分,并分析人格特质对社交网络中链接的影响,然后考虑多方因素建立融入不对称交互与人格链接偏好的链接预测模型。将本文的主要研究内容概括如下:(1)训练适用于微博平台的人格预测模型。首先通过微博小应用的方式收集种子节点id与人格特质得分,再编写爬虫爬取种子节点和扩展节点的基本资料、微博内容、粉丝和关注列表等数据,对数据做筛选、编码和预处理后,按优化后的特征设计方案(包括静态属性特征、文本语言特征和动态行为特征)整理出特征集,其中情感特征在对微博做情感计算时,拓展了网络情感词典和表情符号词典,然后应用皮尔森相关系数和Lasso相结合的混合式特征选择方法选出最终特征集,最后同时训练线性回归、随机森林和决策树的人格预测模型,选择回归效果最好的随机森林模型用于对扩展节点的人格预测。(2)对人格链接偏好的定义。将用户按人格五个维度得分的高低划分,分析不同人格特点的用户其关注用户的人格分布,发现其分布存在差异性,本文将这种差异性定义为人格链接偏好。另外,观察到人格的五大特质之间具有相关性,如开放性与外向性呈正相关与神经质呈负相关,但也有不相关的特质,如宜人性与开放性,所以本文在计算人格链接偏好时,同时考虑五个维度的链接偏好。(3)提出四维综合链接预测模型。本文提出针对有向社交网络做链接预测时,同时考虑用户属性相似度和网络结构连接紧密度(包括改进的基于共同邻居节点的紧密度和基于路径的紧密度),并从不同方向计算用户间的不对称交互强度,再应用本文定义的链接偏好计算基于人格特质的链接偏好匹配度,然后利用已有链接数据对四个维度的权重做训练,确定最优的权重之后计算最终的链接预测概率。最后,通过对比实验验证了模型中的网络结构连接强度、不对称交互强度、链接偏好匹配度对提高链接预测准确率的有效性。总的来说,本文优化了针对中文社交平台的人格预测模型,发现并定义了人格链接偏好的存在,提出了一个针对有向社交网络的链接预测模型,证明了不对称交互强度与人格特质都会影响社交网络用户间的链接关系,最终实现了提高链接预测的准确率的目标,并为社交网络服务平台中的好友推荐算法提供一种新的方案。