社交媒体谣言检测方法

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:mkl119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体的普及改变了人们分享和获取信息的方式。任何人在任何地点,只要拥有一台可以连接互联网的终端设备,就可以实时地跟踪热点新闻,分享自己观点看法。社交媒体在给人们带来便利的同时,也使得大量虚假的谣言能够在互联网上广泛的传播。社交媒体谣言不但会误导大众,而且会对社会和国家造成危害。目前,社交媒体谣言检测方法主要是基于帖子的内容和用户评论数据判断发布的帖子是否为谣言,本文分别针对这两个方面提出了不同的谣言检测方法:(1)现有的谣言检测方法只考虑了评论数据的时序特性而忽视了评论数据的结构特性,针对这一问题,本文提出了两种基于传播结构的谣言检测方法,GLO-PGNN和ENS-PGNN。这两种方法首先都根据帖子之间的评论关系构建传播图,并基于提出的传播图神经网络算法PGNN对传播图中的顶点进行更新;区别在于,GLO-PGNN方法和ENS-PGNN方法采取了不同的谣言分类策略,GLO-PGNN首先从全局角度计算整个传播图的向量表示,然后根据传播图的表示进行分类。ENS-PGNN首先根据每个顶点的表示计算其各自的分类结果,然后进行汇总,得到最终的分类结果。两种方法都引入了注意力机制,通过动态地调整传播图中每个顶点的权重来提高分类效果。实验结果表明,本文提出的GLO-PGNN方法和ENS-PGNN方法能够有效地检测谣言,GLO-PGNN方法在谣言检测任务上的Micro-F1值和Macro-F1值分别为0.759和0.753,ENS-PGNN方法的Micro-F1值和Macro-F1值分别为0.748和0.738,均达到了该领域中的前沿水平。(2)在社交信息刚刚发布时其关注度不高或是发布者自身的关注者较少,用户的评论数据往往也比较少,因而进行谣言检测的难度很大。针对这一问题,本文提出了基于知识图谱表示学习的谣言检测算法。我们提出的知识图谱表示学习算法PN-KG2REC,通过随机游走生成“实体-关系”序列,引入了知识图谱的结构信息;通过引入超矩形(hyper-rectangle)来表征具有相似信息的实体的集合,考虑了实体属性的相似性和差异性;通过生成超矩形区域外的实体,引入了非事实信息,得到的实体和关系表示具有很好的表征能力。采用公开数据的实验结果表明,该方法可以在不依赖用户评论数据的前提下,有效地检测谣言,并且正确率为0.895,达到了该领域的前沿水平。
其他文献
在日常生活中,有许多场景中需要进行数据收集。本硕士论文研究如何使用Wi Fi进行数据收集。Wi Fi的传输速度快、可通信距离长且具有一定安全性,这些优点将有助于实施数据收集工作。本文的主要工作如下:(1)提出了一种基于Wi Fi握手协议的数据收集方案,该方法利用了WPA2加密无线网络的身份认证过程。这种方法仅要求参与者携带任一搭载Wi Fi功能的设备,不需要安装特定的应用程序。此方案是通过捕获加密
学位
随机森林(Random Forest,简称RF)是最经典的机器学习算法之一,由于具有高精度、良好的可解释性等诸多优点,已被广泛应用于计算机视觉和数据挖掘等众多领域。然而观察发现,尽管现实中存在众多的二视图(Two-view)数据,并已获得了广泛的分析研究,但针对二视图场景的随机森林构建却很少,仅有的利用随机森林解决二视图学习问题的方法也都是先为各个视图生成各自的森林,在决策阶段才融合视图间的信息。
学位
进化算法可以较好地解决优化问题,但是对于昂贵优化问题,尤其是昂贵多目标优化问题,却难以以较少的代价得到较好的结果。目前,代理辅助进化算法被证明是解决昂贵优化问题的一种有效途径,本文针对代理辅助进化算法进行研究,主要研究包括以下两点:第一,为了充分整合模型和进化算法,使它们能够相互协作,本文提出了基于多样性的代理辅助进化算法(DSAEA)。DSAEA采用Kriging模型近似每个目标来代替原目标函数
学位
随着智能手机的普及和传感器技术的发展,智能手机中集成了越来越多的传感器,丰富的传感数据为定位技术带来了新的发展机遇。智能手机通过传感器数据为我们提供了各种基于位置的服务,例如地图导航,外卖app等。但是当前许多基于位置的服务都是基于GPS的,它的定位精度一般可以达到5米之内,但是在高度上的误差却有数十米,因此在有海拔变化的场景下容易定位出错,而且它非常耗电,并且提供的是用户的精确位置坐标信息,在一
学位
信息物理融合系统(Cyber-physical Systems)是实现物理资源与信息资源紧密结合在一起的一个组合系统,并通过软硬件相互的联系组成的融合系统。CPS是运行在不同时空范围的分布式与异步的动态混合系统。随着计算机技术的迅速发展,CPS已经有着成熟的发展,同时也在生活与工业上得到了广泛的运用。因此对于CPS进一步的发展,人们将从CPS的功能要求研究进一步扩展到性能评价上,而现在对于CPS的
学位
卫星电源分系统为卫星提供持续可靠的能源,保证卫星的正常运行。电源分系统的工作状态直接影响到卫星其他分系统的状态,决定着卫星其他分系统的性能。因此,检测电源子系统的异常状态是卫星故障早期预警及卫星异常检测中最为关键的一部分。目前,卫星遥测历史数据库存在大量的未人工标签的数据,如何合理且有效地运用这些数据来建立准确的异常检测模型是研究的重点内容。本文从无监督学习,迁移学习和有监督学习三种不同有标签数据
学位
在空中交通管制的过程中,无线电陆空通话是最重要的交流工具。陆空通话目的是为了协助和完成飞行的全过程,是维系空中和地面,管制员和飞行员之间的一条关键纽带。语音识别技术在陆空通话场景下的应用可以有效的提高民航交通运输系统的安全系和降低人力成本。然而,陆空通话场景下的语音识别技术的研究也存在难点。首先,带标注的无线电数据的获取十分困难,由于陆空通话领域的专业性及无线电信道的特殊性,使得相关语料标注人员稀
学位
董泽芳教授从教育社会学视角关注教育分流问题,秉持“公平与质量并重”观,致力于高等教育分流的理念与模式研究。他认为,高等教育分流是充分考虑、统筹兼顾社会发展、个人发展与高等教育发展三方面的需要及条件,而分别给予适度满足的分流,应当基于公平与质量的双重目标,努力构建种类多元、比例合理、相连互通的立体框架;教育分流与教育合流相辅相成,合理的高等教育分流应坚持分合并存、分合结合、分中有合、合中有分。他的研
期刊
作为义务教育阶段中的重要科目,数学产生的教育影响重大。它不但影响学生理性思维的建立,还为后续理科科目的学习奠定坚实的基础,具有重要影响。“顺学而导”理念的教育重心在于锻炼和提升学生的数学思维,逐渐引导学生掌握正确的学习方式,消除学生的数学抵触或者惧学心理,借此提升整个数学教学的有效性。因此,在实际的教育教学中,教师应当注重这一理念的深入,结合学生的发展需要进行教学革新,深化这一教学理念的教学效用,
期刊
近年来,深度学习在计算机视觉领域取得了显著的成果,特别是卷积神经网络被成功应用于各种图像分类和视觉识别任务。但是深度学习在各种应用场景上的有效性很大程度上依赖于大量的标记数据,无监督域适应已经被证明是一种有效的方法去解决一个新的无标签域上的任务,其主要思想是减少源域和目标域的差异,利用标记的源数据集和未标记的目标数据集为目标样本训练强大的分类器。现有域适应方法在进行特征空间对齐的时候只进行了边缘分
学位