基于迁移学习的网络谣言检测研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:liulangdetianya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,以社交网站、微博、博客、论坛为代表的网络媒体成为互联网世界中最大的信息产生与交换渠道,同时也为谣言的生成与传播构筑了温床。网络媒体中的谣言常常以吸引流量制造恐慌为目的,因而往往带有较大的煽动性与恶意性,成为破坏网络空间秩序与环境的一大毒瘤,因此对网络谣言进行有效鉴别,具有较大的经济意义、社会意义与现实意义。在传统的谣言检测工作基础上,本文将重点研究了谣言的领域差异与谣言检测模型的的更新问题。借助迁移学习的思想,通过调整源领域的数据分布,完成对应的迁移任务。具体来说,使用深度迁移网络实现了对网络谣言的跨领域迁移,完成谣言检测模型的构建;使用ACGAN(Auxiliary Classifier Generative Adversarial Networks)架构实现了对网络谣言的跨时域迁移,完成对谣言检测模型的更新。文章创新点如下:一是提出一种基于深度迁移网络的跨领域谣言检测模型。当前的谣言检测使用统一的模型对网络谣言进行检测,忽略了谣言的领域差异。本文在尝试分领域实现对网络谣言的有效检测,对某些领域出现的标注数据不足的问题设计了深度迁移网络进行跨领域建模。假定源领域拥有标注数据,目标领域是无标注数据集,通过深度迁移网络,源领域的有标注数据可以有效迁移,帮助无标注的目标领域构建谣言检测的分类器。二是提出一种基于ACGAN架构的跨时域谣言检测模型。网络谣言的特征随时间发生变化,在谣言检测模型更新时更多考虑谣言的新特征才能有效的更新。本文在模型更新时将数据集分为历史谣言数据与当期谣言数据,通过ACGAN架构中的生成器G对历史数据进行重编码使其数据分布趋向于当期谣言,这样的跨时域数据迁移保证了模型在更新时可以更多反映网络谣言的新特征。实验表明,在跨领域的谣言检测场景下,相较于未分领域的谣言检测方法和分领域但不使用迁移学习的谣言检测方法,本文方法在F1指标上分别提升了10.3%与8.5%,同时与现有方法的对比实验可以看出,文章提出的跨领域谣言检测模型在F1值与稳定性上均优于无监督的方法;在跨时域的谣言检测中,相较于重新训练和预训练的更新方式,本文模型的F1指标分别高出5.5%与3.7%,一定程度上解决了解决谣言特征分布变化带来的谣言检测模型精度下降的问题,提升谣言检测的稳定性。
其他文献
当前,随着人口数量的不断增长,对自然资源的开发日益深入,环境保护的压力越来越大。在发展中不断提高的对土地的需求与保护环境的迫切需求形成了一定的矛盾,因此,如何在保护
我国国土面积辽阔,资源丰富,但人均土地占有量少,随着城镇化进程加快,人地矛盾突出,耕地资源紧张,农用地数量危机加剧。为了促进地区土地资源的集约高效利用,系统科学地对农
微通道热沉以其良好的传热性能已被广泛地应用于电子设备的散热过程,本文以微电子元件散热为背景,以去离子水为冷却流体,在层流状态下采用CFD技术对微通道圆盘热沉、微通道方
选用内蒙古自治区锡林郭勒的胜利褐煤作为研究对象,通过手选法得到不同显微形貌的褐煤,并对其进行矿物质脱除、添加不同的固有矿物质、NaOH处理等预处理,利用FT-IR、SEM-EDS
化石燃料的燃烧和机动车尾气排放的氮氧化物会造成许多环境问题,如酸雨、雾霾、光化学烟雾等,从而危害动植物的健康,并造成大量财产损失。因此,控制氮氧化物的人为排放势在必
壬辰倭乱爆发后,朝鲜王廷一路向北、向西转移,先后在四月和六月接连放弃防守汉城和平壤两座重要城池。汉城是朝鲜王朝的王京所在,平壤作为朝鲜北部战略要地,素有“两西重镇”
作为零件精密磨削工艺中的核心工具,砂轮的磨削性能直接决定着零件的磨削加工质量和效率。镍基合金广泛用作航空发动机核心零件的材料,在对这些核心零件做最后的精密磨削加工
随着工业的快速发展,含油污水的排放、海洋石油的泄漏等油污染情况越来越严重,严重影响了生态环境以及人类的生活,开发清洁高效的吸油材料成为人们研究的热点。高吸油树脂具
作为五大常规无损检测技术之一,涡流检测因具有非接触、对试件表面状态要求低、检测速度快等优点,被广泛应用于导电试件表面和次表面缺陷的检测。涡流传感器在试件中激发出感
随着人们对食品安全及环境保护的重视,农药在果树上和土壤中的过量残留问题备受关注。实施对靶变量施药是减少施药量和降低化学污染的重要技术措施,靶标探测是实现对靶变量施