面向微博的话题层次用户影响力研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:dinc22222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博已经成为人们分享、传播和获取信息的平台。很多的热点话题、敏感话题以及谣言等首先从微博引起,其中的不良信息对社会造成了很大的危害。因此如何在海量的信息中发现热点话题、敏感话题,挖掘出信息传播过程中的关键用户并加以疏导,已成为舆情监管部门关注的热点。本文针对现有的微博话题层次用户影响力分析方法中存在话题获取以及话题中关键用户发现不准确的问题,通过动态聚类算法获取相关话题,从三个方面衡量用户影响力,从而发现关键用户。本文研究成果可为网络舆情监控与追踪起到保障和监督作用。主要工作包括以下几点:  (1)通过动态聚类算法获取微博话题。采用《知网》中词语语义相似度的计算方法获取微博短文本之间的相似度,解决了微博短文本关键词频过低导致文本间相似度计算不准确的问题。依据微博之间的相似度矩阵,建立一种改进的k-means算法对微博文本进行聚类,实验结果表明本文算法聚类结果具有较高的耦合性和紧凑性。  (2)在话题层次,根据信息之间的转发关系和用户之间的关注关系构建话题传播网络, 在该网络中借鉴PageRank思想,实现了一种TDN-If算法得到话题传播网络中的影响力用户,该算法与RepostRank、TweetRank,In-degree和TweetNum算法相比,表现出了较高的准确率和召回率。  (3)建立了一种话题层次用户影响力度量模型。首先分析了传统影响力指标与用户影响力的关系;然后分析用户的属性特性、行为特性以及信息传播特性对用户影响力的影响,进而给出本文的影响力指标:用户微博价值影响力、用户活跃度影响力、信息传播影响力,并分析这三个指标与用户影响力的关系;最后融合上述三种指标建立一种用户影响力度量模型。实验结果表明,本文给出的三个影响力度量指标与用户影响力关系更密切。  
其他文献
随着Internet技术的飞速发展,远程教学作为一种新型的教育模式已经成为近年来各国教育界的重要研究课题。其中实验教学的实现成为了研究的重点和难点,而虚拟实验是解决这一问
随着网络技术的不断发展,尤其是多媒体应用需求的增加,出现了一对多、多对多的组通信需求,针对互联网上的大规模一对多数据分发问题,有三种可选的通信模型,分别是纯单播,IP组播,应用
目前,随着全球经济的快速发展及金融系统的信息化,金融网络中洗钱犯罪已受到各个国家的广泛关注,因此,金融网络中发现洗钱社区结构的研究已经成为人们关注的热点。  本文通
本论文和相关研究得到国家自然基金(基金号:60273090)的支持。特征提取是联机手写藏文识别进行中的关键问题。围绕这一难题,本文依据统计和结构两种方法的优点,提出了统计与结构
JVT发布的新一代视频编码标准H.264,相对于其他早期视频编码标准有很大改进,性能较MPEG4和H.263++有明显提高。它在网络的服务质量适配性方面也得到加强,同时也促进了对视频
在互联网的发展过程中,基于数据库的资源管理方法和基于统计的搜索策略发挥了重要作用,但随着领域资源的不断丰富,传统的方法暴露出一些不足。主要表现在:(1)由于缺乏语义信
XML是一种自描述的元标记语言,它是完全面向数据的。它的扩展性和灵活性允许其描述不同结构的Web站点的数据,从而能够使不同来源的数据容易地结合在一起,因此人们逐渐采用它
随着通信技术的发展,传统的通信业务从数据、语音的通信逐步向视频通信发展。目前,视频通信主要承载于有线网络上,如数字电视业务主要承载于有线电视网络上,可视电话主要承载于公
随着信息时代的急速发展,互联网成为人们进行信息交流与传播的最便捷和最重要的工具,但是不良信息也开始在互联网上扩散和传播并成为人们关注的热点。  词袋模型不仅用于文
本文重点设计完成了基于矿山安全管理的矿山预警应急管理系统的初步研究工作。 安全是矿山生产能够正常运作的关键因素,如何对矿山安全进行有效预警和应急救助,是目前在矿山