基于主题模型的有向社交网络链接预测

来源 :西南大学 | 被引量 : 0次 | 上传用户:jrong520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络自上世纪90年代兴起以后迅速发展,近几年大型社交网络的普及程度越来越高。“社交网络”成为了当今最受关注的互联网名词之一,它正在不断改变人们的生活和交流方式,网络中的社交关系成为了人际关系中不可或缺的一部分。与此同时,社交网络中的数据量也在呈几何倍数增长着,如何从这些海量的数据中挖掘出有用的信息成为了研究热点。社交网络的数据挖掘主要是挖掘用户间的关系,即链接挖掘。链接预测作为链接挖掘的一个重要子任务,因其重要的理论和应用价值受到了广泛关注。现有的链接预测主要是基于简单的无向无权网络,而简单的网络模型已经不能满足形式日渐多样化的真实社交网络。本文主要考虑用户关系具有明显单向性的社交网络,构建有向网络模型来模拟真实的社交网络进行链接预测。  现有针对有向社交网络的链接预测方法主要基于节点的网络结构相似性,多数是将用于无向无权网络的相似性指标拓展到有向网络中,未深入分析有向网络的结构特点。而且,现有方法通常仅考虑网络结构进行链接预测,忽略了社交网络中用户之间的文本语义关系。目前考虑用户文本语义信息的链接预测方法多数是直接对文本信息进行分析,无法捕捉文本中潜在的语义信息,且由于社交网络中文本信息的数据量庞大,需要耗费大量资源。针对上述问题,本文提出一种结合有向网络结构信息和用户潜在语义信息两种特征的有向社交网络链接预测模型:1、针对有向网络的结构特点,详细分析有向网络三节点的模体结构(network motifs),在有向资源分配指标的基础上考虑模体的多种同形异构体,提出一种适用于有向网络的相似性指标,用于描述有向网络结构特征;2、针对用户的潜在语义信息,用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型对社交网络中用户发布的文本兴趣进行建模,在文本信息中提取潜在的语义兴趣特征,降低文本维度以提高获取语义兴趣特征的效率;3、将链接预测看作一个二元分类问题,结合基于网络结构和基于用户潜在语义兴趣的两种特征,采用有监督的机器学习分类方法进行链接预测。  通过在真实的社交网络LiveJournal数据集上进行链接预测实验,证明提出的针对有向网络的相似性指标能够更准确地捕获有向网络结构特点,本文提取语义兴趣特征的方法能更有效地描述用户间的潜在语义关系,且结合有向网络结构和社交网络中的用户文本语义信息能够有效提高有向社交网络的链接预测精度。
其他文献
学位
学位
近年来,计算机在交通控制、通讯网络等各个领域得到了广泛的应用.支持上述应用的基础理论问题为求解该领域内的NP完全问题的实用与快速算法.对上述领域内NP完全问题的快速算
随着三维扫描技术、计算机辅助设计等的不断发展,人们对三维模型精度也提出了更高的要求,三维模型的数据量也越来越大。虽然计算机的硬件性能也越来越高,但日趋庞大的三维模型数
学位
随着经济社会的不断发展,现代项目管理越来越成为理论和实践关注的热点问题。作为项目管理者,所关注的问题是如何合理地调配有限的资源,高效完成各项项目指标。项目调度问题作为
数字图像修复是数字图像处理领域中的一个重要分支,是指对一幅不完整的数字图像中缺失信息的重建过程,无论是在面向数字化照片处理的应用领域,如数字化的破损文物壁画、老照片的
昆虫机器人是一种以昆虫为载体,并辅助以一定的控制设备而成的新型机器人。昆虫机器人的研制重点在于如何控制昆虫机器人的飞行行为,控制昆虫机器人必然要求精确地获取昆虫机器
学位
学位