社交网络数据获取与结构分析系统的设计与实现

被引量 : 0次 | 上传用户:ihwren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0时代的到来,使得互联网技术朝着更加人性化的方式发展,Twitter、 Facebook、微博、朋友网、人人网等社交软件也随之兴起并飞速发展,目前,人们的日常交流活动基本都是在这些社交软件所提供的平台上进行。人与人之间以这些社交软件为媒介进行有目的的信息交流,从而产生关系网络,这种以人,和人与人之间关系而构成的社会网络结构,称之为社交网络。社交网络的两个结构要素是节点和边,节点一般指人,边是人与人之间的关系。顺应科技发展的需要而产生的科研合作网络,是科研合作的产物,是科研学者之间的社交网络,而科研合著网络又是科研合作网络中由科研学者之间通过合著论文而产生关系从而构成的合著者之间的社交网络。本文研究的对象为社交网络中有代表性的两种网络:微博用户关系网络和科研合著网络,前者是有向网络,后者是无向网络。社交网络的概念来源于社会学,自提出以来就引起了国内外学者的广泛关注,到目前为止,社交网络的研究热潮仍未退去。网络数据的获取是社交网络研究所要解决的首要问题,但是,大多数已有的关于社交网络的研究,其网络数据来源是公用数据集,或者模拟的网络数据集,这在一定程度上不能准确地反映社交网络结构的真实情况。所以,从互联网上获取真实的社交网络结构数据就显示尤为重要,也使得社交网络的研究成果更加具有实际意义。本文设计的社交网络数据获取与结构分析系统实现了真实数据的获取,分别从新浪微博系统和DBLP数据库中获取真实的新浪微博用户关系数据与合著关系数据。社会网络分析方法和复杂网络分析方法是被国内外学者广泛认可的两种社交网络结构分析方法。对于科研合著网络来说,分析其网络结构,对促进科研合作的继续发展,预测某一领域的发展方向等具有重要的作用。对于微博用户关系网而言,分析其网络结构,对于市场运营、用户推荐等都有着重要的借鉴意义。本文设计并实现的系统采用社会网络分析方法中的角色分析方法研究科研合著网络结构,对意见领袖和结构洞进行分析研究,采用复杂网络分析方法研究新浪微博用户关系网络的拓扑结构特性。本文设计并实现了社交网络数据获取与网络结构分析系统,主要工作如下:1、介绍了本文在设计并实现系统时涉及到的相关概念和技术。2、设计并实现新浪微博数据获取与网络结构分析功能,使系统可以完成从新浪微博系统中获取真实的用户关系数据,对数据进行去噪处理,并生成关系网络结构图,且采用复杂网络分析方法对网络拓扑结构特性进行分析等一系列工作。3、设计并实现科研合著网络数据获取与结构分析功能,使系统可以完成从DBLP数据库中获取以“数据挖掘”为主题的四个级别的学术会议收录的论文合著数据,对数据进行处理,生成合著网络结构图,检测出top100个结构洞和意见领袖等功能。4、以top100个结构洞和意见领袖为研究对象,分别从论文数、citation number、H-index和G-index这四种衡量科研学者学术成就的重要指标进行对比分析。
其他文献
沉香因资源稀少,价格昂贵而受到投资者的关注。然而,这也使得假货猖獗。因此,投资者应该认清形势,谨慎投资。
全社会用电量变化受到政策、经济、人口、气候、资源等诸多不确定因素的影响,是一个庞大的不确定系统。在日常电力预测实践中,往往比较注重对单一指标的相关性分析,对每一种
近十多年来,随着我国房地产市场高速发展,房价在不断上涨,城市改造不断升级,工业园区蓬勃发展,虽然皖北B市政府在违法建设治理方面竭尽所能地投入了相当多的人力物力,但是违
本文选取《跟马小跳学汉语》这套比较新颖的教材作为研究对象,对教材进行多维分析。本文共分为五章,第一章为绪论,主要阐述了本文的选题缘由、研究目的和研究意义。第二章为
随着世界人口的不断增加和社会经济的快速发展,群体性事件与日俱增,从而人群安全问题已经成为人们关注的热点问题。视频监控技术的高速发展是对群体性事件控制的重要技术保障。
目的:分析延伸护理服务对提高患者腹膜透析换液操作正确率的影响。方法:科室成立持续质量改进(CQI)小组,选取笔者所在医院2013年6月-2017年3月居家腹膜透析患者48例,提供延伸
近几年虐童事件频繁发生,经过媒体一再的曝光,引起社会各界高度关注,但最后都是以行政处罚和或者民事赔偿结案,显然这种处罚力度没有有效地遏制虐童事件的发生,随着社会经济的发展
现代市场经济是信用经济,信用是个人或者经济组织发展的关键,甚至是一国经济市场发展的基础。随着我国金融市场开放的加深,信用评级机构在我国金融体系中扮演着越来越重要的角色