基于改进线性阈值模型的用户影响力算法研究与平台实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:a15088392710
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展和网络技术的不断进步,微博逐渐成为很多人们日常生活中不可或缺的一部分。我们知道,人们通过发布微博、转发微博、给其他微博点赞、为其他微博评论等行为与周围的其他人的联系越来越紧密。与此同时,对于微博以及微博用户的研究也逐渐增多。通过对微博用户的研究我们发现,某些用户较另外一些用户在微博这个虚拟世界中更受欢迎,我们称之为“意见领袖”。而显然这些意见领袖在微博系统中充当着及其重要的角色,他们的一言一行对整个网络也都有着很大的影响。对于这些意见领袖,企业可以通过他们推广自己的产品,新闻媒体可以通过他们进行新闻的迅速传播。但同时,这也使得某些不法分子通过微博造谣滋事。微博通过其海量的数据信息、极高的传播速度将真实生活中的事件转移到虚拟世界中,随着社交网络关系逐渐变得更加复杂,对于社交网络的研究也显得更加迫在眉睫。社交网络中有着大量的错综复杂的关系,对于社交网络的研究,我们既可以从用户方面展开,也可以从微博方面展开。本文在相关工作的基础上,提出了改进的线性阈值模型,基于现有微博系统设计了方便第三方影响力平台使用接口。本文的主要研究内容和成果包括:1)从微博网络结构出发,分析网络节点属性,根据网络背景信息,探究基于最多转发关系、网络平均距离、转发比率等算法模型,并实验得出上述三种基于网络结构的模型结果。2)对于微博用户的特点,我们从微博文本中的博主与其他博主的交互信息分析用户的活跃度。然后基于传统的线性阈值模型,我们通过将之前的用户活跃度加权到用户激活阈值中而得改进的线性阈值模型。最后基于真实数据集通过实验验证改进的线性阈值模型,我们最终以63%的近似度得到了TOP-K用户。3)由于现有的影响力分析研究都缺乏相应的结果展示平台,为了使研究人员从繁杂的平台前后台开发中脱离出来,也为了方便信息传播实验的进行以及结果的展示,我们通过使用CXF、Axis2技术开发了用户影响力分析平台的API以及部分用户行为模拟功能。通过模拟功能我们可以模拟用户的所有微博行为,包括发布微博、转发微博、评论、点赞等;通过API我们可以以RPC的方式远程访问后台而不需要经由前端。对于开发的API,为了方便使用,我们开发了WSDL文档对于各API接口进行了说明。最后我们对于API和模拟功能进行了测试,结果显示可以实现需要功能。4)从系统使用角度而言,基于影响力算法,我们设计并实现了影响力平台系统。为了方便结果展示,我们开发了从数据获取到微博系统展示到影响力结果展示的平台框架。为了实现结果的动态更新,我们加入了影响力排名结果动态更新的机制。
其他文献
为了有效校正选择偏差问题,该文运用倾向得分匹配法(PSM)构造反事实,利用2005-2013年湖北县级层面的面板数据,在拟自然实验环境下识别出重点县认定标准和重点县政策对贫困减
文章基于对股权转让纠纷问题的研究,分析了股东优先购买权的性质,对理论及实务中存在的有关合同效力的学说进行了对比研究,研究表明:在我国形式主义股权变动模式下,采用"生效
20世纪90年代中国独立纪录片影像表达至今仍然具有研究价值。对九十年代中国独立纪录片创作研究的基本综述,不是采用广泛收集各种相关研究文献进行综合分析,而是以吕新雨、张
检察建议在民事行政检察监督工作中发挥了积极作用,但缺乏法律授权、相关规范性文件效力不理想、实务中适用随意性大等问题限制了该项制度功能的发挥。应加强检察建议理论研
国家实施了新一轮的全国老工业基地振兴,我们要抓住这一重大机遇,打造东北经济新支撑带。在战略定位上要确定四个支点,开发五个亮点,打造T字型东北经济带。同时需要国家在税
抢夺、抢劫两种犯罪严重危害公民人身安全和财产安全,是司法机关重点打击的犯罪。如何正确界定、准确量刑、有效打击两抢犯罪,始终是司法工作者面临的一大难题。因此,研究分
最近互联网上纷纷传出苹果公司每年可以避税几十亿美元。如此大金额的合法避税引起了人们的关注,也因此受到美国政府审计机构指责。从中我们可以得到启示:综合利用税收筹划方
农村集体经济组织收益分配纠纷是当前农村经济社会发展当中凸显出来的新问题,是经济、政策、传统等多种因素共同交织所形成的典型性、代表性的问题。因此,从经济、政策和传统
科技革命推动下的生产力的发展,使资本主义社会告别了短缺经济时代进入生产相对过剩时代,消费开始代替生产成为经济持续发展的制约点,以炫耀性消费为主要特征的消费主义应运