微博热点话题中的齐普夫定律实证研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kby0227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,各种移动平台广泛应用,即时通讯软件日益丰富,在社交网络平台中,微博从一出现就受到了网民的大力追捧。由于其不仅具有实时性、原创性、灵活性等特点,而且也能根据个人兴趣进行选择关注和互动,很好地满足了网民非接触式的社交需求,因此很快发展成为社交网络平台的重要应用。当前微博用户已达亿级别,庞大的用户群体通过分级传播的方式使微博上大量的热点话题内容得到了全方位的传播和完善。微博现已成为信息沟通的重要桥梁和纽带,很多突发事件都是从微博上第一时间发布出来,对微博热点话题的研究已成为微时代大众传播的一个重要议题。因此,借助计算机自动处理海量微博信息,研究微博话题传播规律,对于了解社交网络结构、洞悉舆论热点、掌握舆论动向有着重大意义。为了从海量微博信息中获取到有效的数据信息,本文利用微博平台开放API与网络搜索相结合的方法获取话题数据,其中重点研究了基于腾讯微博平台开放API的数据获取方式,主要包括Oauth2.0授权、数据库存储和有效信息归并分类,实现了数据的高效获取和有效信息筛选。在研究中本文以国内拥有用户最多的新浪微博和腾讯微博为对象,分别从单话题和多话题两个方面对话题数据进行了特性分析,单话题研究中选取了12个具有代表性的热点话题进行分析,多话题研究中根据新浪微博热榜和腾讯微博每日热点话题推荐共选取了1731个热点话题进行分析。通过对话题数据筛选整理,函数拟合,最终得出结论,微博热点话题的频次与其排名符合齐普夫定律。概括起来,本文主要做了以下三个方面的工作,一是分析微博用户网络结构和话题传播周期;二是研究如何基于微博平台开放API获取微博信息;三是针对突发性热点从单话题和多话题两个方面分析微博中的话题数据,验证了话题数据符合齐普夫定律的特性。
其他文献
在21世纪,互联网信息量巨大,同时以惊人的速度增长,而现有的搜索引擎无法对巨量的信息形成有效检索。形成这种局面的原因主要有以下两方面:一是用户需要特定的信息资源,而信
在机器学习和自然语言处理领域中,语义模型(Topic Models)是一类基于统计理论的概率模型,它一般通过构建出“词汇—主题—文档”来发现语料库(文档集合)中的潜在的主题(语义)
随着物联网技术的发展,在一个分布有大量6LoWPAN传感器节点的监测区域中,通过一个功能强大的边界路由器实现域内传感器节点接入IPv6网络,并与IP网络的相互通信,是实现物联网
当今社会互联网日益普及,近几年来涌现出了大量社交网站,这使得人们能够更加方便的利用网络交换信息实现自己的个人发展。如何将网站服务器中存储的大量用户数据构造成一个社
传统的掌纹识别主要是基于掌纹二维图像,从图像中提取掌纹纹理信息作为特征来进行身份识别,然而二维掌纹识别存在以下缺陷:受光照影响严重;手掌颜色变化或污渍会影响识别精度
现实世界中,90%的知识来源于文本,从文本知识源中获取专业知识是一种重要的途径。但不同的文本对对象的描述往往有所不同,为了获取完备的知识,需要从多种文本知识源中挖掘。
经过30多年的发展,目前RDS(Radio data System)技术在欧美等一些发达地区已经成熟,其应用也进入到人们生活中的各个领域,并深受人们的喜爱。RDS作为一种低成本、技术成熟以及
近年来,光电技术突飞猛进,指纹采集仪器的功能也越来越强,高分辨率指纹识别逐渐走入人们的视野。相比传统的指纹识别,高分辨率指纹识别不仅能够提取更高分辨率的指纹细节信息
随着科学技术的日益发展,人们能获取到的数据量已经呈现出爆炸的趋势。如何能够利用好这些数据,特别是历史数据,越来越受到人们的关注。数据仓库、联机分析作为商业智能的重要部
随着软件开发领域的不断发展和系统规模的日趋复杂,传统软件开发方法暴露出越来越多的问题,如代码重用性差、软件研发效率低、模块间耦合度高等问题。当前软件开发技术已经难