在线社交网络用户间最短路径查询算法研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:skyskysky094411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络社交的快速普及,在线社交网站逐渐成为人们日常社交活动的主要载体,吸引了众多用户。而根据社交网络中用户间关系和其社交活动所抽取出的社交网络数据,比传统的数据更具有复杂性和多样性,引起了研究者们浓厚的兴趣,主要体现在:一、社交网络拥有规模巨大的用户群体,其节点数量达到数百万甚至千万级别以上,节点间关系的数量更是达到亿万级别;二、社交网络中的数据具有较强的动态性,人们的社交活动具有很强的随机性,时刻都会有新节点的加入和退出以及关系的产生和消亡;三、社交网络中的关系具有多样性,在不同的社交网络中,其关系的类型、强弱程度以及是否具有方向等特点都会有所不同。因此,在处理复杂的社交网络数据时,如何为其选择最佳的数据模型,如何合理地存储数据以及高效、准确地处理查询请求,是相关研究的重点方向,也是推动社交网络服务发展的主要动力。  本文以社交网络中用户间的好友关系为基础,将其抽象成一张无向无权图,并建立模型。在此基础之上,探讨图数据中节点间最短路径查询的相关算法及优化策略。文章首先介绍了社交网络的相关概念和基础理论,为后续研究工作的展开做理论铺垫;然后对已有的图数据中节点间可达性和最短路径查询算法及其性能进行详细介绍,并在Sketch算法的基础上,对基于最短路径树的节点间最短路径查询算法提出了两个方面的改进:一、在查询时,使用双向多最短路径树联合搜索优化策略;二、在路标节点的选择策略方面,使用随机抽样的方法来寻找覆盖率较高的节点作为路标节点,以提升最短路径树的覆盖率,进而提高查询结果的准确度。该算法属于基于路标估计算法的范畴,但传统的基于路标算法只能得到一个距离的估计值,而使用最短路径树的算法可以在快速求出节点间最短路径估计距离的同时得到真实存在的节点序列,另一个优势在于最短路径树结构支持在运行时以较低的代价来进行节点和关系的实时插入和删除操作,具有较强的适应性和可扩展性。通过在真实社交网络数据集上的实验结果表明,该改进算法在查询的时间、空间复杂度和准确率上都有一定的提高;本文最后还将基于最短路径树的算法用在社交网络的实际应用之中,包括节点间最短路径求解、图和节点的分离指标估算以及基于距离的社交搜索排名等,并通过实验来对比估计结果和真实结果,验证了该算法在实际应用中的准确性和实用性。
其他文献
骨龄作为评价骨骼发育程度的数据指标,被广泛应用于临床医学、体育运动和法医学等领域。目前鉴定个体的骨龄主要是通过人工方式观察手骨X射线图像的每块骨骼的成熟程度,最终计
学位
学位
随着生命科学的发展,RNA新的功能被逐步的发现,对于RNA的研究已经成为当今生命科学领域的一大热点,RNA组学(RNomics)的提出更是将对RNA的研究推向了一个更高的境界。而作为研究
随着网络技术的快速发展和以云计算为代表的新兴计算方式的普及,面向服务的软件体系结构正日趋成为开发跨组织、跨平台的复杂软件系统的主流技术。鉴于网络环境的动态性,服务质
学位
近年来,大数据以数据量大、数据类型多样、难辨识、数据产生速度快和价值高的5V特性成为工业界和学术界关注的热点。另一方面,大数据存储和处理的需求也推动了技术的发展。作为
语义Web是一个具有丰富语义的数据网络,它通过语义Web标准、标记语言和处理工具对现有Web进行了扩展,使计算机可以更好地与用户协同工作。在语义Web的层次结构中,本体处于中心位
面对不确定、不完整和不一致的数据信息,粗糙集理论是一种很好的数学工具。经典粗糙集理论不适合有缺省数据的现象,即不适合不完备决策信息系统;在经典粗糙集理论中,分类分析必
随着现代移动通信技术和手机短信业务的发展,由于手机短信廉价、快速、方便等特点,短信交流已经是人们日常生活的一部分。但是,由此也带来了问题,不良分子利用了短信业务成本低廉