基于链接分析的微博用户可信度研究

来源 :兰州交通大学 | 被引量 : 4次 | 上传用户:adamsqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一种新型的社交网络平台正受到越来越多人的青睐,使用微博平台分享和获取信息已经成为人们交流的重要方式。由于微博的自发性、低约束等特点,以及缺乏对用户有效的管理与制约手段,导致在微博用户数量快速增长与微博信息飞速传播过程中,微博虚假信息及谣言泛滥。因此,微博用户可信度问题逐渐引起人们的关注,成为一个亟待解决的问题。微博信息属于互联网信息的一部分,其短文本格式和复杂的社交网络特性给微博用户及其信息的可信度研究带来了巨大挑战。目前,微博用户可信度研究方面取得了一些初步成果,但存在着评价方法单一,元素特征考虑简单,算法复杂度高等不足。本文基于现有微博可信度研究成果,以新浪微博为研究对象,运用社会网络平衡理论知识对微博用户间信任传递关系进行分析。并从链接分析角度出发,基于PageRank算法思想,结合用户的特征属性,研究了一种评估微博用户可信度的模型及算法,针对同一微博领域用户的可信度排序进行相应的实验及分析。论文主要研究内容如下:首先,论文分析了微博的结构特点,研究了新的交流模式对用户可信度行为造成的影响,综述了可信度研究相关理论与主要技术,探讨了微博信息可信度研究内容,对比分析了当前微博可信度研究模型和表示方法。其次,论文基于微博信息传播机制及社会网络平衡理论,分析微博用户之间的信任传递关系,发现稳定微博网络结构中可信度相近用户之间更易建立关联。基于PageRank思想,将微博用户可信度排序问题转化为群体用户的信任支持问题,而用户间的链接即是用户因需求而产生的信任支持行为,进而从链接分析角度提出了微博用户可信度评估模型。最后,论文分析微博用户的特征属性及相关行为关系,结合本文模型设计了相应的可信度排序算法。算法利用非平均权值的思想,更加强调用户粉丝质量的重要性,能够有效降低用户可信度得分排序结果中僵尸粉的影响。基于网络爬虫获得的微博群体用户数据的实验结果表明了算法的有效性。
其他文献
在信息化社会里,特别是随着电子商务,电子政务的发展和广泛应用,信息安全显得格外重要。为了保证电子支付、电子合同、电子投票、电子文件等电子信息的安全性,数字签名随之产生。
报表引擎是报表工具软件的核心组成部分,它控制报表系统的运行过程,为灵活多变的企业级报表展示提供强有力的软件支持。在研究报表引擎工作原理、Eclipse插件、RCP、XML、OSG
随着计算机体系结构的发展,多核平台得到了越来越广泛的应用。多核平台与并行计算理论相结合,以多线程并行的方式使应用程序性能大为提高。然而在图形领域,多核平台的应用尚未展
本体映射旨在不同的本体间搭建语义桥梁,以期实现不同本体间的信息交流和知识共享。对于大规模本体,由于其概念数量庞大、相互之间关系复杂,要实现大本体之间的映射变得非常
随着社会信息化进程的不断深入,办公软件已经成为人们日常办公不可缺少的基础软件之一。但自上世纪以来,各个办公软件厂商大多采用封闭专有的文档格式,这些标准不开放,存在安全隐
无线传感器网络是由大量传感器节点组成并以多跳自组织方式构成的无线网络,各传感器节点通过协作方式感知、采集、处理和传输监测区域内被感知对象的信息,并最终把这些信息发
XML已成为Web上数据表示、集成和交换的标准,它格式简单、自描述能力强,越来越多的应用如信息集成、电子商务等使用XML来存储、交换和发布信息。有效地存储和查询XML文档是技术
随着空间数据获取技术的快速发展,空间数据量急剧增加。为了充分地利用空间数据库中的资源,在大量的数据中获取有价值的信息,提出了空间数据挖掘技术。空间数据挖掘技术可以
随着互联网的广泛应用,信息安全问题已成为当今待解决的首要问题之一。密码技术是使信息安全到达最重要的手段。密码体制可分为传统密码体制和公钥密码体制。公钥密码体制可
随着近代计算机技术的飞速发展,孤立词语音识别系统已经取得了较高的识别准确率,非特定人、大词表连续语音识别技术成为当前的研究热点。本论文在国家自然科学基金项目的支持