论文部分内容阅读
Web2.0时代的到来,使得互联网技术朝着更加人性化的方式发展,Twitter、 Facebook、微博、朋友网、人人网等社交软件也随之兴起并飞速发展,目前,人们的日常交流活动基本都是在这些社交软件所提供的平台上进行。人与人之间以这些社交软件为媒介进行有目的的信息交流,从而产生关系网络,这种以人,和人与人之间关系而构成的社会网络结构,称之为社交网络。社交网络的两个结构要素是节点和边,节点一般指人,边是人与人之间的关系。顺应科技发展的需要而产生的科研合作网络,是科研合作的产物,是科研学者之间的社交网络,而科研合著网络又是科研合作网络中由科研学者之间通过合著论文而产生关系从而构成的合著者之间的社交网络。本文研究的对象为社交网络中有代表性的两种网络:微博用户关系网络和科研合著网络,前者是有向网络,后者是无向网络。社交网络的概念来源于社会学,自提出以来就引起了国内外学者的广泛关注,到目前为止,社交网络的研究热潮仍未退去。网络数据的获取是社交网络研究所要解决的首要问题,但是,大多数已有的关于社交网络的研究,其网络数据来源是公用数据集,或者模拟的网络数据集,这在一定程度上不能准确地反映社交网络结构的真实情况。所以,从互联网上获取真实的社交网络结构数据就显示尤为重要,也使得社交网络的研究成果更加具有实际意义。本文设计的社交网络数据获取与结构分析系统实现了真实数据的获取,分别从新浪微博系统和DBLP数据库中获取真实的新浪微博用户关系数据与合著关系数据。社会网络分析方法和复杂网络分析方法是被国内外学者广泛认可的两种社交网络结构分析方法。对于科研合著网络来说,分析其网络结构,对促进科研合作的继续发展,预测某一领域的发展方向等具有重要的作用。对于微博用户关系网而言,分析其网络结构,对于市场运营、用户推荐等都有着重要的借鉴意义。本文设计并实现的系统采用社会网络分析方法中的角色分析方法研究科研合著网络结构,对意见领袖和结构洞进行分析研究,采用复杂网络分析方法研究新浪微博用户关系网络的拓扑结构特性。本文设计并实现了社交网络数据获取与网络结构分析系统,主要工作如下:1、介绍了本文在设计并实现系统时涉及到的相关概念和技术。2、设计并实现新浪微博数据获取与网络结构分析功能,使系统可以完成从新浪微博系统中获取真实的用户关系数据,对数据进行去噪处理,并生成关系网络结构图,且采用复杂网络分析方法对网络拓扑结构特性进行分析等一系列工作。3、设计并实现科研合著网络数据获取与结构分析功能,使系统可以完成从DBLP数据库中获取以“数据挖掘”为主题的四个级别的学术会议收录的论文合著数据,对数据进行处理,生成合著网络结构图,检测出top100个结构洞和意见领袖等功能。4、以top100个结构洞和意见领袖为研究对象,分别从论文数、citation number、H-index和G-index这四种衡量科研学者学术成就的重要指标进行对比分析。