基于深度学习的多模态网络谣言检测研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:goonesownway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展,社交网络已经成为人们生活中重要的一部分。在社交网络中,人们不仅仅是信息的接收者也是内容的创造者。诸如微博、推特等平台大大加速了人与人之间信息交流的速度和深度。目前,社交网络已经成为了人们获取信息的最重要的渠道。在这样的便利环境下,社交网络也降低了不实信息的传播成本。与传统的文本信息相比,带有图像的信息不仅能提供更加丰富的情节来吸引更多的读者,而且能够增加信息的可信度,然而这常常被恶意用户所利用。如何对分辨出多模态的虚假谣言并阻止虚假信息的传播,已成为近年来热点研究领域之一。同时在消息传播过程中所产生的评论数据被证明有利于谣言检测,如何处理评论数据也是研究者们所关注的问题。本文研究基于深度学习的多模态网络谣言检测方法,主要工作包括以下几个方面:1.研究了网络爬虫技术,针对推特平台和微博平台的特点,设计网络爬虫方案。根据Scrapy框架和Redis数据库,实现了针对微博数据的并行爬取。针对推特平台,利用Flask框架作为API密钥的管理服务器,对推特平台进行多线程爬取。并将爬取的数据分别存储,构建了模型的训练数据集。2.提出了一个融合传播模态的基于注意力机制的深度学习框架MBC(MultiattBLSTM-CNN),用来融合评论特征和源信息特征。首先将源信息和评论信息按发文的时间顺序进行排列,通过Text-CNN模块来获得评论数据和源消息数据中的文本特征。接着利用多头自注意力机制学习评论与评论之间和评论与消息之间的交互特征,进一步学习时序序列中潜在的拓扑特征。然后将更新后的多模态数据进行平均池化送入分类器。最后设计了对比实验进行性能的比较,实验验证了该模型的有效性。3.提出了一个融合视觉模态的基于注意力机制的深度学习框架MFN(Multimodal Fusion Network),用来融合源信息的视觉特征和文本特征。首先通过BLSTM和TextCNN抽取文本的时序语义特征和n-gram局部特征。然后利用预训练的Faster RCNN模型来抽取图片的细粒度特征。接着利用多头注意力机制学习单词与图片中的目标兴趣区域之间的潜在联系,从而更新文本特征和视觉特征。之后利用注意力机制来融合多个模态特征输入到分类器中。最后设计了对比实验进行性能的比较,实验验证了该模型的有效性。
其他文献
随着车联网的构建和互联网技术的广泛涉及,汽车已经不单是代步工具更是人工作生活中的重要部分。车载中控系统是人与车进行交流的媒介,也是车企和众多互联网公司进行合作以赢得差异化竞争的关键部分。但现阶段车载中控系统的信息交互模式仍然是相对固定的,停留在人主动适应汽车的状态,从真正意义上讲并未达到交流互动的目的,驾驶者实现熟练驾驶操作的过程中往往会因为紧张的状态和学习时间成本,造成驾驶体验不好,也增加了驾驶
收费站是提升高速公路系统通行效率的关键位置。电子不停车收费(Electronic Toll Collection,ETC)是提升收费站通行能力的有效措施,经过长时间的发展,ETC用户比例在不断增加,2019年出台的多项政策进一步加快了ETC全面普及的进程。ETC用户的快速增加使得ETC车道异常事件的不利影响逐渐凸显,因此本文旨在量化异常事件对收费站通行效率的影响,进而合理优化车道配置,降低社会效益
本文讨论了不依赖于时间的Navier-Stokes方程最优控制问题的数值解法,通过Q2-Q1混合有限元离散,将此类控制问题转化为一个大型稀疏的非对称鞍点问题。为有效求解此类病态的鞍
格奥尔格·毕希纳(Georg Büchner,1813-1837)是德国19世纪重要的现实主义作家、戏剧家,德国现代文学的先行者。在短暂的24岁生命中,毕希纳一共创作出四部文学作品,它们都在德国文学史上产生了重要的影响。其中,《沃伊采克》是毕希纳的未竟之作,是他留下的几个不同版本的手稿断片。这部戏剧是毕希纳根据社会真实事件改编而成,讲述了身处社会底层的士兵沃伊采克的悲剧命运。毕希纳在这部作品中探讨
社区公共空间作为城市居民日常生活的重要载体,在公共空间产生的活动与提供的多样功能常常被视作是真实城市居民生活的映射。然而随着城市的快速发展,城市社区人口密度的快速扩增,长期以来,城市社区公共空间的建设采用的模式化、套路化的设计方式,已无法满足当前居民的生活方式与精神需求,同时产生了基于年龄差异的公共空间的空间占据、时间使用时长等不公平现象,最终产生社区居民间矛盾。针对上述问题,论文以城市社区公共空
20世纪90年代以来,伴随着中国经济体制转轨和社会结构转型的加速,城市在剧烈变迁中出现了一系列新问题。社会阶层分化,贫富差距扩大,贫困群体作为城市弱势群体逐渐边缘化、集中化。成都市作为近年来发展最为迅速的城市之一,阶层分化、收入差距等问题日益凸显,旧城区、城中村和城市边缘区等典型的贫困聚居区都有出现。从发达国家治理路程来看,成都市正处于集中拆建贫困聚居区的第一阶段。解决城市贫困人口的集中化、边缘化
当今社会已经迈入了万物互联时代,大量终端的存在为这个社会产生了大量的信息与数据。在信息收集之初,大家并不完全清楚最终想要的是哪些数据,大而全地收集数据成为了一个较为稳妥地选择方案,也因此造成了最终的数据中包含了大量无用甚至垃圾的数据。数据的质量会对学习模型的性能产生重要的影响已经是行业内的一个普遍共识。大规模的数据也会提高模型的学习时间,降低学习效率。因此,对原始数据进行特征选择已经成为机器学习领
新一代Caa S云服务模式的形成,为用户提供了快速构建具有敏捷性的生产环境,加快了产品的研发和发布周期。以Docker为代表的容器虚拟化技术凭借其轻量级、易移植、快启动等优点迅速在工业界得到应用,随之用于管理部署大规模集群容器的Kubernetes凭借其强大的管理功能、较好的兼容性以及开源等特点成为业界主流的容器编排系统。然而当前Kubernetes最核心的调度功能仅包含较为单一的调度策略,难以适
随着互联网技术的更新、算法和大数据的发展以及网络应用的传播与普及,我们进入到一个“万物皆媒”的时代,依靠网络技术和大数据平台为基础的内容聚合平台兴起,聚合型视频平台、音乐平台以及新闻搜索类平台广泛出现于大众视野中,不可避免的会引发新旧媒体间的冲突。新媒体时代的到来一方面给网络信息的发展带来了极大的便利,同时也给人们的生活带来了天翻地覆的改变,然而从另一方面来看,新媒体的兴起与广泛适用也引发了较为严
无缝线路是现代铁路的主要组成部分,而钢轨焊接是无缝线路建设中的关键环节。闪光焊由于其具有自动化程度高、接头质量好、焊接速度快及焊接质量稳定等优点,已成为钢轨焊接最主要的方法之一。钢轨闪光焊焊接接头质量主要取决于合理的温度场分布、钢轨顶锻前端面的状态以及与温度场匹配的顶锻过程。其中,温度场分布和钢轨顶锻前端面的状态可以通过改变闪光工艺进行调整。由于闪光焊的特殊性,没有外加保护气体,仅靠在闪光过程中高