基于多任务学习的假新闻检测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yaonulio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,越来越多的人选择在网络上阅读新闻。不同于传统新闻媒体,互联网新闻有许多新特点,如获取成本低、时效性高等特点。然而,大量包含虚假信息的新闻得以在各种社交媒体上肆意传播,其大量涌入给互联网新闻这一领域带来了严重的负面影响。因此,如何识别假新闻,并及时停止其传播,对构造一个良好的互联网氛围至关重要。假新闻检测并非易事,其甄别过程往往需要专业的背景知识。现阶段检测假新闻的主要方式是人工审核,考虑到互联网上新闻的数据量之大、传播范围之广,人工审核的方式很难解决效率低、时延性高等不可避免的问题。随着人工智能的发展,研究者们期望通过人工智能技术自动地检测假新闻。然而,互联网上传播的新闻其文本内容的长度较短,这使得传统的基于文本的假新闻检测方法难以取得满意的效果。本文研究了基于多任务学习的假新闻检测问题。互联网新闻往往会在多个社交媒体上发布与传播,这些新闻涵盖了大量不同的主题,传统的基于手工设计特征的机器学习方法很难保证设计特征集的泛化能力。考虑到在一些主题下假新闻出现的概率更大,本文挖掘了新闻的真实性和新闻的主题之间的内在关联,并提出了一个基于多任务学习的假新闻检测模型(Fake news Detection via Multi-task Learning,FDML)。FDML模型基于深度神经网络,可以自动地从新闻内容中学习到相应的特征,同时处理假新闻检测任务和主题分类任务,在学习过程中挖掘新闻真实性和新闻主题之间的内在关联,从而提升假新闻检测和主题分类的效果。互联网上新闻的文本内容普遍较短,并且假新闻通常是作者有意误导读者而撰写的,所以仅依靠新闻文本内容的假新闻检测很难取得令人满意的效果。考虑到新闻在发布时会伴随一系列上下文信息,例如新闻作者、作者历史信用表现等,这些信息可以有效的提升假新闻检测的效果。因此,FDML模型综合考虑了新闻的文本内容和新闻的上下文信息,通过结合多个特征进一步提高假新闻检测和主题分类的效果,在来自真实世界的数据集上的相关实验验证了本文提出模型的有效性。此外,本文实现了一个假新闻可视化与检测系统,提供数据收集、数据分析、假新闻检测模型部署等功能。
其他文献
介绍了基于共享变量的SPMD型自动并行化模型,给出了从串行源程序生成以EP-860并行计算机系统为运行环境的并行程序源程序的过程,并详细讨论了一些关键技术和实现方法。
伴随着政党政治的发展,政党制度对国家政治制度的运行有着举足轻重的作用,它不仅规范了政党及其政治活动,而且反映了一个国家的社会性质、历史传统和现实发展等等。中国共产
物联网作为一种全新的技术,正在经历一个从物品局域联网、局部系统的智能服务与管控等向全网融合逐步深化的过程。从2003年底开始,我国开始探索物联网技术在仓储管理方面的应用
北京泛华恒兴科技有限公司(简称:泛华恒兴)近日推出了热电池测试系统。该系统通过有效控制热电池放电,并在放电过程中对电性能参数进行高效采集和分析,从而完成对热电池放电电流、
由于资源、授权有限以及在文化、理念甚至性格等方面的差异,很多工程项目管理人员在项目管理过程中走进了误区,给国家、建设方、承建方造成了一定程度的浪费和损失。本文从项目
一、引言知识越来越成为提高综合国力和国际竞争力的决定性因素,人才已成为推动经济社会发展的战略性资源,这就对人才培养提出了更高的要求。教育组织肩负着更加重要的历史使命
主体性教学已成为大学体育教学中被普遍接受的基础性理念,但在具体教学中,普遍存在对主体性简单、机械的理解.通过对互主体性体育教学实验的描述与分析,提出互主体性教学是真
在当下电子商务背景中,更多厂商决定采取厂商推荐以缓解渠道冲突。所谓厂商推荐,是指厂商决定采取何种推荐策略将其他厂商的产品推荐给消费者,并从中收取一定推荐费用以赚取更多利润。具体而言,本文主要考虑在垄断市场和推荐市场的条件下,通过比较不同推荐策略所带来的利润大小,根据厂商利润最大化原则,判断厂商在满足特定条件下应采取何种推荐策略,对厂商的运营决策具有较强的理论指导和现实意义。在垄断市场中,假设有一家
为提高认知无线电的频谱感知性能,提出一种联合信任度与信噪比的自适应协作频谱感知算法.该算法通过信噪比估计和信噪比比较获取各认知用户的初始信任度值,自适应地调整信任
临床使用的大多数抗肿瘤药物都能引起程度不等的恶心、呕吐,尤其是顺铂、氮芥、亚硝脲类药物等.有时因胃肠道反应严重,导致部分患者化疗难以进行,同时也给病人带来很大痛苦.1