基于组合深度模型的社交媒体谣言检测

来源 :云南大学 | 被引量 : 0次 | 上传用户:oncecao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体时代,人们在网络平台获取和分享信息越来越普遍,这无疑加剧了社交网络的复杂性,伴随而来的是网络上谣言的泛滥。网络谣言会带来诸多社会问题,影响社会稳定与和谐,社交网络上的谣言检测已然成为越来越受到重视的热门研究问题。随着深度学习框架的产生和发展,针对社交平台上网络谣言检测,引入深度学习框架是一个有效的解决办法。从网络信息中获取深层语义信息和文本特征是谣言检测的关键。对于复杂的网络信息来讲,单一方法很难去很好地处理和提取其特征。为了更好地进行社交媒体上谣言的检测,本文从谣言检测流程中的多个角度出发,提出了一种组合深度模型的谣言检测方法。本文的工作重点在于:多模型混合使获取到的文本信息相对多样化,更好地获得深层语义信息和高质量的文本特征,进一步提高谣言检测的准确性。本文主要工作如下:(1)在预训练模型BERT中采用了新的内部学习方式,把源贴和相关的评论看作单个文本块,进行每个文本块的内部学习,并且将每块学习到的内容与预训练模型中表示整个文本语义的[CLS]做交互。(2)对预训练模型的输出结果,根据其特点,使用不同的深度模型进一步学习并且使用Co-Attention进行强化,提高模型性能。具体来讲,使用可以获取局部空间特征的卷积神经网络(CNN)、获取时序特征的双向长短期记忆网络(BiLSTM)和协同注意力(Co-Attention)进一步进行特征学习并优化。组合方法相比单一方法更具有鲁棒性,能获取事件信息中更多的隐藏特征,以此提高谣言检测的准确率。(3)在真实的微博和Twitter数据集上进行实验,证明本文提出的方法相比于基线方法在准确率等方面有不错的检测性能,又通过消融实验展示各部分对模型性能影响的大小,说明所提模型的整体优势和组合设计的合理性。实验表明,组合模型在所用数据集上的检测结果的误差率普遍降到3%左右。
其他文献
党的十九大以来,国家提出“乡村振兴”战略掀起了乡村建设的高潮,村庄规划作为乡村建设的前提和蓝图,是乡村建设的关键内容。近些年,随着美丽乡村建设、脱贫攻坚等一系列政策的推动,村庄规划水平有了一定程度的提升。但现行村庄规划中,绝大多数是政府“包办式”的规划,村庄规划参与主体仅为政府与规划单位,村民参与度低、认可度低、落地率低,对按照村庄规划开展乡村建设热情不高,村庄规划无法发挥指导村庄建设、发展和开展
学位
乡村振兴,治理有序是保障,法治建设是关键。党的十九大报告指出,要贯彻新发展理念,全面实施乡村振兴战略,要坚持农业农村优先发展,按照产业兴旺、生态宜居、乡风文明、治理有效、生活富裕的总要求,建立健全城乡融合发展体制机制和政策体系,加快推进农业农村现代化。要推进国家治理体系和治理能力现代化,要建立自治、法治、德治相结合的新型基层治理体系,为今后中长期“三农”工作发展和乡村建设、乡村治理指明了方向。农村
学位
“十三五”以来,旅游业与其他产业跨界融合、协调发展,产业规模不断扩大,新业态不断涌现,旅游业对经济平稳健康发展的综合带动作用更加凸显,各地区纷纷将旅游业作为主导产业、支柱产业,放在优先发展的位置,为旅游业营造优质发展环境。“全域旅游”是一种新兴的旅游理念与绿色发展新道路,受各区域政府大力推崇,“全域旅游”标准示范区在创建的过程里,旅游业发展模式从一开始的“景区旅游”的模式慢慢地转化成了“全域旅游”
学位
学位
运动式治理,从宏观的角度来看是我国实行的符合我国国情的一种治理实践,也是国家层面为了更好的解决一系列社会问题的主要途径,尽管在短期内,获得了良好的成效,但也存在一定的问题,例如:一是结果反弹,二是短期效应,三是运动性,实践中也面临着合法化困境、成本与效率的困境等。在国家治理要不断推向现代化转型的环境背景下,分析为何运动式治理作为治理工具频频被选择?其产生的原因是什么?面临的困境是什么?其优化及转型
学位
随着中国特色社会主义市场经济的发展,涵盖高新技术产业开发区、经济技术开发区、产业园区、综合保税区、开发开放试验区、边(跨)境经济合作区等形态的各类开发区,已经成为最重要的产业承载平台和地方经济无可替代的增长极。在中国经济飞速发展的过程中,开发区做出了巨大的贡献,成为推动我国工业现代化、城镇规模化、产业集群化以及对外开放的前沿阵地,兼具“土地集约利用、设施集中配套、产业集群成链、要素集聚支撑、资源高
学位
报纸
污水处理是县级政府公共服务中的重要内容,本文以云南省安宁市(县级)污水处理为案例,梳理了该县在提供污水处理这一公共服务的治理模式,主要表现为三个阶段:即政府主导的单中心治理模式(2006-2012年);市场主导的单中心治理模式(2013-2016年);单中心逐渐转变为政府为核心、市场主体和社会主体参与的多中心治理模式(2017年至今),通过对研究对象的深入分析,查找了县级污水处理存在困境和成因,主
学位
将车辆在行驶中的数据记录到区块链中可以有效解决数据真实性和安全性问题,是目前区块链及车联网领域研究的重点。然而,车辆在使用区块链技术时完成的工作量证明(Proof-of-Work,Po W)会消耗大量的能量和计算资源,限制了区块链技术在车联网环境中的应用。因此,我们考虑部署边缘计算节点来支持区块链技术的使用,并通过引入拍卖机制鼓励用户作为矿工来记录车辆的行驶数据。本文针对车联网中的车辆在使用区块链
学位
野生蛇体态多变、纹理丰富、移动迅速,与其它细粒度图像分类相比,其类间相似性更大,类内相似性更小,导致野生蛇细粒度分类难度系数更高。传统的卷积神经网络模型随着卷积层数的加深过于专注局部信息而忽略局部信息之间的关联,从而损失较多的整体信息。本文通过迁移学习和敏感度分析在多比例数据集上对比卷积神经网络和自注意力网络从而筛选出效果较好的Swin Transformer模型。为了进一步提升模型效率,本文从多
学位