一种基于贝叶斯网络的社交网络链路预测算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ld2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,在线社交网络已变得越来越流行,社交网络成为了一种人与人之间进行交互的新方式。人们在使用社交网络的过程中产生了海量的数据,如何从社交网络数据中分析与挖掘潜在的用户关系进而辅助商业决策成为了研究热点。链路预测作为一种用来发现用户之间潜在关系的社交网络分析技术,在近些年来获得了大量的关注。社交网络链路预测通过利用当前社交网络中的数据信息来预测用户之间将来可能产生的链接关系,对社交网络分析起到了重要作用。目前主流的社交网络链路预测方法可分为基于用户之间相似度计算的非监督式链路预测方法,以及基于机器学习的监督式链路预测方法。这些方法中可能存在以下缺陷:没有充分利用到用户基本属性信息、需要额外的缺失数据处理过程,以及模型缺乏较好的可解释性。针对现有链路预测算法中存在的缺陷,本文提出一种基于贝叶斯网络的监督式社交网络链路预测算法。根据用户之间在基础属性信息以及关系网络结构上的相似程度,从社交网络数据中提取出用户之间的用户属性“相似性”特征,以及网络结构“相似性”特征。贝叶斯网络作为一种概率图模型,能够充分学习出变量之间的相互关系。本文利用贝叶斯网络来学习用户属性与网络结构的众多“相似性”特征以及链接关系之间的概率分布,进而更准确地预测出用户之间产生链接的概率。充分利用先验知识来优化构建贝叶斯网络结构,并利用EM算法改进贝叶斯网络参数学习方法使得算法适合处理数据缺失问题。使用AUC与精确率作为链路预测算法的性能评估指标。通过设计实验,对比常用链路预测算法,评估基于贝叶斯网络的链路预测算法的预测准确率以及对缺失数据的处理能力,并分析社交网络中的各用户属性因素对用户关系的影响程度。实验数据结果表明,在利用到网络结构信息与用户属性信息的情况下,本文提出的基于贝叶斯网络的链路预测方法预测结果的AUC与精确率值均高于常用链路预测算法。同时,在不同程度数据缺失的情况下算法仍然具有较高的预测准确性。
其他文献
在小学数学教学改革存在着四种基本矛盾,本文从这四项基本矛盾出发,并针对这四项基本矛盾提出了自己的意见和建议,以供同行参考。
产业集群统计是全面统计和描述一定时期产业集群基本发展情况的工作体系 ,最早起源于产业集群发达的西方国家。本文分别从理论和实践两个方面探索了欧美国家产业集群统计的起
初中文言文的词语主要分为实词和虚词,它们是近年来中考的热点。很多学生对于实词和虚词的掌握不到位,不知道如何去学习。文章对初中文言文中的实词和虚词的学习重点进行了分
女性主义运动第二次浪潮之后,女性电影就成为了许多女性主义者研究的对象。在本篇论文中,笔者也将通过九十年代的一些法国电影来分析当时法国女性的身份问题。通过对影片当中女
当前中美贸易失衡持续保持高位,人民币汇率水平承受着巨大争议。本文在回顾中美经贸关系发展历程与现状的基础上,通过实证分析表明中美贸易失衡和人民币汇率之间没有必然联系
人参是在世界范围内广泛应用的传统中药,其最主要的活性成分为人参皂甙,主要包括Rb1、Rb2、Rc、Rg1等单体。研究发现,人参皂甙对心血管系统具有良好的保护作用,它可以通过抑
经济全球化的发展带来了全球人口的自由流动和商业贸易的迅速发展,但同时也加剧了传染性疾病的蔓延。不仅传统的艾滋病、结核病、疟疾等传染性疾病在全球继续肆虐,近些年来新出
中国古代把二十八宿划分为四象,所根据的是某一时刻二十八宿排列在空中的地平方位,而不是根据四季天象。因此,只有四象与四方的对应关系,而不存在四象与四季的对应关系。那种
期刊
目的:建立毛细管气相色谱法测定盐酸美金刚原料药中三氯甲烷残留量的方法。方法:色谱柱为DB-1701石英毛细管柱,柱温采用程序升温,检测器为电子捕获检测器,检测器温度为250℃,
将金属套管式微通道用于油包水(W/O)乳液的制备,系统考察了连续相中大豆油和正己烷的体积比、表面活性剂质量分数、套管环隙尺寸和微孔孔径等对乳滴粒径的影响。得到的较优制备