基于深度学习的社交网络谣言检测技术研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:yuanxb2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,社交网络逐渐成为人们获取新闻资讯的重要来源之一。在带来便利的同时,社交网络也为谣言的危害性传播提供了途径。目前,谣言检测已经成为学界重点研究的课题,而早期检测和精准检测是其关注的两个方面。现有的谣言检测方法通常使用单一模型应对早期检测和精确检测的挑战,这会导致以下问题:第一,现有的谣言检测方法具有评论依赖性,在谣言传播早期缺乏评论数据的情况下,难以做出准确判断;第二,在评论数据足以构筑完整传播结构的情况下,现有的谣言检测方法未能充分挖掘谣言的传播特征,造成检测精度不足。针对早期检测中存在的评论依赖性问题,本文提出基于文本和用户特征的早期谣言检测方法ERD-GAT-VAE(Early Rumor Detection Based on Garph Attention Network and Variable Auto-Encoder),依靠挖掘谣言文本的深层表征和用户信息进行即时性的初步检测;并在此基础上,结合充足的历史评论数据,提出基于双向传播图的多任务精确谣言检测方法SNRD-BDPG-MTL(Social Network Rumor Detection Based on Bi-Directional Propagation Garph with Multi-task Learning),该方法能够有效地挖掘谣言的广度和深度传播特征,从而实现对谣言的精确检测。最后,基于以上两种方法,本文设计并实现了社交网络谣言检测原型系统,为用户提供一套涵盖早期和精确检测的社交网络谣言检测机制。本文主要工作如下:(1)针对谣言早期检测中存在的评论依赖性问题,本文提出了基于文本和用户特征的谣言检测方法ERD-GAT-VAE。首先,在不依赖评论数据的前提下,本文提出图注意力依存树模型(Graph Attention over Dependency Tree Model,GADT)用于获取谣言文本的深层表征向量;其次,本文创新性地提出基于变分自编码器的用户可信度评估模型(User Credibility Evaluation Model,UCE),用于获取用户可信度表征向量;最终融合文本深层表征和用户可信度表征向量获取早期检测结果。实验结果表明,ERD-GAT-VAE方法能够在谣言传播的前12小时内提供较为准确的初步检测结果。(2)针对谣言精确检测中存在的检测精度不足问题,本文提出一种基于双向传播图的多任务谣言检测方法SNRD-BDPG-MTL。该方法首先提出Bi-AEGCN(BiDirectional Attention Enhanced Graph Convolutional Network)模型,用于充分挖掘谣言的传播特征;然后利用ERD-GAT-VAE方法获取的文本和用户表征,结合帖子统计特征,引入立场检测任务作为辅助,从而提高谣言检测的准确率。实验结果表明,SNRD-BDPGMTL方法在准确率和F1值上都获得了较好的效果。(3)基于以上研究,本文设计并开发了社交网络谣言检测原型系统。对于用户自主提交的社交网络帖子,该系统使用统一内容标签(Uniform Content Label,UCL)进行归一化处理,分别利用本文提出的ERD-GAT-VAE和SNRD-BDPG-MTL方法进行早期和精确检测,为社交网络用户提供一套包括早期和精确检测的社交网络谣言检测机制。
其他文献
近似计算是一种常用于容错性应用中的计算电路设计手段,该方法是通过牺牲一定数据精度来提升集成电路的能效。近期的研究表明,卷积神经网络推理过程存在离散的分类特征,对计算中可接受误差的容忍度比较高。本课题结合对数近似计算原理,设计了一种能效较高卷积计算单元,可以在保证一定精度的情况下降低计算单元功耗,提升卷积神经网络硬件加速器的能效。本文的设计工作主要有三点。1.优化了对数近似计算原理中的高位筛选算法,
随着高移动性和易用性的移动设备的大范围普及,无线通信服务的规模日益增长。同时大量的数据通信也会带来能量需求增大以及无线传输安全的问题,如何解决这些问题成为了越来越重要的焦点。本文主要研究了在无线通信传输过程中的安全问题,主要内容归纳如下:1.考虑了一个D2D的能量收集系统中,结合Q学习的思想,提出了一种在线学习的能量传输调度方案,该方案能够根据信道信息和电池的剩余电量状态,确定电池的充电时长使得能
学位
第五代通信技术(5G)近些年来发展迅速,在5G网络中,设备到设备(D2D)通信的应用缓解了5G基站的通信压力,提升了通信系统的频谱容量;物联网(Io T)设备的发展推动了5G网络中物联网系统的广泛应用。然而,D2D通信和Io T设备的通信都存在着一些安全问题。当前5G网络D2D通信中,存在着数据机密性难以保证、以及无法实现细粒度访问控制的问题;虽然采用属性基加密算法(ABE)可保证D2D通信的机密
作为我国南极科考的度夏站,泰山站存在能源供应不足现象,为保障泰山站的科考活动正常开展,需要无人值守能源平台为南极科考设备提供持续的能源供应。受环境影响,泰山站冬季处于无人值守状态,为保障无人值守能源平台长期稳定运行,需要为其提供远程通信服务。本文根据实际项目需求,设计并实现无人值守能源平台的数据通信系统,为国内工作人员监测和控制无人值守能源平台提供了渠道。本文对无人值守能源平台的数据通信系统进行功
分布式优化是当前研究的热点问题,其在大规模机器学习、智能电网、无线传感网络等领域中都有着广泛的应用。分布式优化算法依赖于多个智能体之间的相互通信,一方面,这会带来单个智能体的隐私泄露问题;另一方面,大规模网络结构下通信受到通信能耗过高、通信带宽有限等现实条件的制约。因此,分布式优化算法的隐私保护性以及通信效率成为衡量算法性能的重要指标。然而,已有的具有隐私保护性的分布式优化算法往往面临通信成本较大
近年来,基于物联网技术的应用层出不穷,既有便利人们生活的智能家居、智能交通、智能医疗等系统,又涵盖有益于社会稳定的基础设施等管理服务。然而,设备节点与服务器建立远程通信的过程缺乏安全保护,完全暴露于复杂的网络环境中,极易遭受网络攻击,从而导致数据泄露、非法用户入侵系统等问题。目前,针对智能设备与智能手机间的安全通信方案是以智能手机主动向智能设备发出通信请求为通信起点,不同于本文中受限节点主动与应用
头痛疾病是所有神经系统疾病中最普遍的疾病,然而我国面临着医生诊断准确率相对较低的问题。现阶段,国内外通行的头痛病诊断标准是国际头痛学会制定的国际头痛分类(ICHD),目前已经更新到了第3版(ICHD-3)。因此,设计基于ICHD-3的头痛病辅助诊断模型,对推动ICHD-3在临床实践中的应用,提高头痛病的诊断质量具有重要的意义。本文结合项目需求,设计了一个带有解释机制的头痛病辅助诊断模型,并实现了用
二进制协议逆向技术对管理网络通信行为、保障网络安全及提高网络服务质量有着重要意义。不同于文本类协议,二进制协议缺少文本编码信息,字段边界无明显的分界符,协议逆向难度比文本协议逆向更高。目前基于多序列比对的二进制协议格式的提取方法对噪声敏感度较高,并且当协议格式较为复杂,字段值多变时,多序列比对算法的插空操作过多造成部分字段边界发生偏移。此外基于协议状态字段提取的二进制协议状态机推断方法对协议字段提
随着半导体工艺的发展,工艺尺寸愈发缩小,电路的工作电压不断降低。在这种工艺演进的场景下,发展设计工艺协同优化(Design Technology Co-optimization,DTCO)平台在评估、验证并且尽可能多的优化半导体工艺以及电路设计方面带来了极大的帮助。在DTCO平台中,静态时序分析扮演着重要的电路时序评估的角色。由于低电压下电路延时呈现明显的非高斯分布,传统的统计模型难以精确地表征时