论文部分内容阅读
随着经济的发展和网络技术的不断进步,微博逐渐成为很多人们日常生活中不可或缺的一部分。我们知道,人们通过发布微博、转发微博、给其他微博点赞、为其他微博评论等行为与周围的其他人的联系越来越紧密。与此同时,对于微博以及微博用户的研究也逐渐增多。通过对微博用户的研究我们发现,某些用户较另外一些用户在微博这个虚拟世界中更受欢迎,我们称之为“意见领袖”。而显然这些意见领袖在微博系统中充当着及其重要的角色,他们的一言一行对整个网络也都有着很大的影响。对于这些意见领袖,企业可以通过他们推广自己的产品,新闻媒体可以通过他们进行新闻的迅速传播。但同时,这也使得某些不法分子通过微博造谣滋事。微博通过其海量的数据信息、极高的传播速度将真实生活中的事件转移到虚拟世界中,随着社交网络关系逐渐变得更加复杂,对于社交网络的研究也显得更加迫在眉睫。社交网络中有着大量的错综复杂的关系,对于社交网络的研究,我们既可以从用户方面展开,也可以从微博方面展开。本文在相关工作的基础上,提出了改进的线性阈值模型,基于现有微博系统设计了方便第三方影响力平台使用接口。本文的主要研究内容和成果包括:1)从微博网络结构出发,分析网络节点属性,根据网络背景信息,探究基于最多转发关系、网络平均距离、转发比率等算法模型,并实验得出上述三种基于网络结构的模型结果。2)对于微博用户的特点,我们从微博文本中的博主与其他博主的交互信息分析用户的活跃度。然后基于传统的线性阈值模型,我们通过将之前的用户活跃度加权到用户激活阈值中而得改进的线性阈值模型。最后基于真实数据集通过实验验证改进的线性阈值模型,我们最终以63%的近似度得到了TOP-K用户。3)由于现有的影响力分析研究都缺乏相应的结果展示平台,为了使研究人员从繁杂的平台前后台开发中脱离出来,也为了方便信息传播实验的进行以及结果的展示,我们通过使用CXF、Axis2技术开发了用户影响力分析平台的API以及部分用户行为模拟功能。通过模拟功能我们可以模拟用户的所有微博行为,包括发布微博、转发微博、评论、点赞等;通过API我们可以以RPC的方式远程访问后台而不需要经由前端。对于开发的API,为了方便使用,我们开发了WSDL文档对于各API接口进行了说明。最后我们对于API和模拟功能进行了测试,结果显示可以实现需要功能。4)从系统使用角度而言,基于影响力算法,我们设计并实现了影响力平台系统。为了方便结果展示,我们开发了从数据获取到微博系统展示到影响力结果展示的平台框架。为了实现结果的动态更新,我们加入了影响力排名结果动态更新的机制。