基于新浪微博的移动社交网络复杂特性研究

被引量 : 19次 | 上传用户:bombwang1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
iPhonel的诞生从很大程度上促进了传统社交网络的移动化趋势,现如今移动社交网络已经成为人类日常生活中必不可少的一部分。Twitter和Path等高质量的移动社交网络能够在短期内积累大量用户,而Facebook、人人等大型传统社交网络服务也在加快移动设备的部署。我国最大的移动社交网络是新浪微博,截至2012年6月已经积累了3.5亿用户,其中超过60%的用户使用移动设备进行登陆。由于移动社交网络与复杂网络模型的相似性,可以将移动社交网络用户作为节点,用户与其他用户之间的关系作为该节点的有向弧,构造复杂网络模型。本文以新浪微博作为研究对象,克服网络爬虫局限性,依据新浪微博开放平台API接口限制,构造算法,在保证内存分配的情况下减少对API的调用,共收集了2999个用户节点、232623条连边的样本,构造模型并对其从三个方面进行了研究:在复杂网络结构及特性方面,本文通过计算发现样本网络的平均入度达到了77.57,而最大直径为6,验证了六度分离理论在新浪微博用户网络中是成立的。本文发现该样本网络的入度分布服从幂率分布形成了一个无标度网络;出度分布服从指数分布形成了一个ER随机图。在新浪微博与Twitter的比较中发现新浪微博的网络密度和节点重要性控制都不如Twitter。在复杂网络鲁棒性方面,通常的研究方法是针对复杂网络进行结构上的随机故障与蓄意攻击的模拟,此外,本文还进行了一种更符合实际情况的蓄意性随机攻击模拟。蓄意性随机攻击模拟要求在进行攻击时,依概率损毁重要节点,改变节点状态,使之成为普通节点,对普通节点则直接进行删除。蓄意性随机攻击更适合新浪微博网络中用户遭受攻击侯的实际情况。模拟最终发现新浪微博网络具有出人意料的鲁棒性。在复杂网络的用户群体发现方面,本文介绍了社团结构的定义以及划分社团结构的两种方法——谱系聚类算法以及GN算法。本文采用谱系聚类方法进行了节点聚类,并首次绘制出了新浪微博的两种网络结构图,在研究中并未发现明显的社团结构。本文最后,对移动社交网络数据挖掘提出了一些建设性意见供参考。
其他文献
钢铁行业不仅是我国国民经济的支柱性产业,也是关系着国计民生的基础性行业,在我国实现工业现代化进程中发挥了不可替代的作用。钢铁行业的发展对一个国家的基础建设以及工业
随着计算机的普及,互联网影响的深入,各行各业都进入了办公自动化时代,宿舍管理系统也在高校得到了广泛应用。但随着高校的扩招,学生数量的大幅增长,现有的宿舍管理系统单单满
伴随着赖以生存和发展的自然资源的濒于枯竭,资源枯竭型城市不同程度地面临经济增长滞缓、就业压力激增、财政资金短缺、居民生活困难、生态环境破坏等一系列问题。其中,就业问
城市基础设施和住房建设是国民经济和社会发展的重要组成部分,是社会可持续发展的关键因素。进入21世纪,我国国民经济迅速发展,城市化进程不断加速,随之而来的大规模城市基础
学术界一般认为,《史记》的文学价值被真正发现,《史记》被作为文章典范来阅读学习是自明代开始的。在此基础上,本文认为凌稚隆辑《史记评林》,李贽以《史记》为五大部文章之
采用红外光谱表征了KH-550的结构。用不同浓度的KH-550乙醇溶液处理铝表面,并用环氧胶黏剂粘接铝与铝的界面,测定其剪切强度。采用扫描电镜研究了KH-550预处理前后的铝与环氧
第一部分目的:了解我国门诊高血压患者血压达标率及其影响因素。方法:采用多中心的横断面临床流行病学调查,在我国北京、上海、广州等分布不同地理位置的22个城市中,选择了92家
改革开放以来,中国处于从计划经济向市场经济转型的大背景下,各行业所处的市场正经历着从垄断逐步走向竞争的发展阶段。与此同时,中国经济持续高速增长,国际地位显著提升,中
作为作家,施林克在推理小说方面颇有成就。1989年他的作品《快刀斩乱麻》获得了德国推理小说大奖“格劳斯奖”。而小说《生死朗读者》无疑是他最轰动的作品。《生死朗读者》