论文部分内容阅读
随着互联网的发展,各种不同类型的社交平台出现并且在人们的工作生活中扮演着不可或缺的角色,越来越多的人选择将更多的日常或工作交流移至社交平台进行,人们在社交平台上发布观点或者分享信息,这些社交行为产生的大量数据使得社交网络成为蕴含个人信息和感情的载体。本文将社交平台产生的数据分为两个层面,一是社交群体层面,二是社交个体层面。社交个体构成社交群体,即社交群体数据是由社交个体数据构成,所以本文工作重点是对两个层面的数据的关联性分别进行分析。基于社交群体数据对社交网络拓扑结构进行分析并对群体数据的可视化方法进行优化和改进;基于社交个体数据与用户的关联性,建立模型并提出一种对社交用户人格倾向性预测的方法。基于社交群体数据的关联性分析,由于用户间的关联性可以映射为用户间的相似度问题,所以本文通过社交平台群体数据构成的网络拓扑结构确定社交平台用户间的相似度,以此进行关联性分析。具体是从两个方面对社交群体数据的关联性进行分析,一是基于社交内容的用户相似度分析,即通过对社交用户的社交数据的分析,建立社交用户模型,基于用户模型确定用户之间的相似度;二是基于社交网络拓扑结构的用户相似度分析,即通过用户的社交关系数据建立社交网络拓扑模型,并从社交关系网络结构方面出发对用户的相似度进行分析。在群体数据分析中,本文对社交网拓扑图的可视化方法进行研究,其中对基于FR布局的d3-force力导引布局算法从三个方面进行改进,实验结果表明优化获得了更好的可视效果。基于社交个体数据的关联性分析,由于社交个体数据是构成社交群体数据的单位,所以对社交个体数据的分析也是很重要的研究内容。社交个体数据在一定程度上能够反映出用户个体特征信息,实验表明,将用户个体数据与个体人格潜在特征相关联是确定用户人格特征的一种可行方法。本文将社交用户产生的数据与用户的人格倾向性相关联,对特征值进行抽取和筛选,通过机器学习方法建立人格倾向性预测模型。实验表明,对用户人格特征值的抽取与筛选对预测结果的精确度有显著地提高,而且用户的社交特征与用户人格特征也存在着密切的关联。