基于MixMatch模型的互联网虚假新闻判别研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:AceAcer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每个人都离不开新闻,新闻的意义在于传播消息,揭露真相,在丰富人民日常生活、促进社会健康发展等方面都具有重要作用。随着互联网的普及,微博、今日头条等网络社交媒体逐渐崛起,游览互联网新闻逐渐成为人们获取日常信息的主要方式。互联网带给人们迅速吸收和分享新闻的便利,同时加速了虚假新闻的生产和传播。虚假新闻削弱了媒体的公信力,损害了公民的知情权,影响社会和谐稳定,造成难以估量的损失。近年来人工智能技术不断进步,利用技术手段对互联网虚假新闻进行自动、及时的判别成为热门研究课题。就当下的虚假新闻判别任务而言,研究人员大多将判断新闻的真假看成机器学习二分类问题,收集带标签的新闻样本,建立监督学习模型,提取新闻的文字内容作为分类特征。然而,互联网每天能产生大量新闻,无标签的新闻数据时效性强且更容易获取,用无标签新闻结合有标签新闻数据,构建半监督判别模型,与监督学习模型相比可以有效的节约数据收集成本,提高模型泛化能力。此外,许多互联网新闻用图片吸引读者,对新闻图像特征的挖掘可能有助于判别任务。基于此,本文提出用半监督学习的方法解决虚假新闻判别任务,建立Mix Match半监督模型,在半监督模型中引入数据增强方法,提高无标签样本生成伪标签的准确率,分别使用EDA简单文本数据增强方法、图像几何变换增强方法和Mix Up数据增强算法。同时提取新闻的文本信息和图像信息,分别建立BERT语言模型和ResNet卷积神经网络模型进行新闻文本和新闻图像信息的提取。分析Mix Match半监督学习方法、数据增强方法和文本与图像结合的特征提取方法相比传统的监督学习方法对虚假新闻判别任务有无提升作用。研究结果表明,在判别特征的选取上,融合了新闻文本和图像信息的判别模型所得结果要优于单独使用文本信息的判别模型,明显优于单独使用图像信息的判别模型,文本信息对虚假新闻判别任务起主要作用,图像信息对判别任务有一定的辅助作用。在判别方法的使用上,使用Mix Match半监督模型得到的结果不逊于使用EANN、artRNN等监督模型的结果,要优于使用BERT、Res Net单一文本或图像监督模型分类的结果,Mix Match半监督模型的准确率能够达到甚至优于监督模型,相较于监督模型具备数据收集成本低、模型泛化能力强的优势,可以应用在虚假新闻判别任务上。数据增强能够让模型对新闻文本和图像的信息提取更充分,同时帮助半监督模型中伪标签的获取,包含数据增强步骤的Mix Match模型准确率要优于不包含数据增强步骤的Mix Match模型准确率,数据增强方法对判别任务有提升作用。
其他文献
枸杞具有丰富的食用和药用特性,深受消费者喜爱。作为具有较高附加的特色农产品,枸杞早已被列入地理标志保护产品名录。由于枸杞的品质与产地密切相关,不同来源枸杞的销售价格存在较大差异,导致市场售卖的枸杞鱼龙混杂,极大地影响了消费者的购买信心,对相关产业的发展产生了一定影响。因此,建立准确可靠、高效简便的枸杞产地判别方法是十分必要的。本文分别应用电感耦合等离子体质谱仪(ICP-MS)和元素分析仪-稳定同位
杨砦峪金矿床位于华北克拉通南缘,是小秦岭金矿田大型石英脉型矿床之一,关于区内金矿床成矿流体及成矿物质来源尚存争议。在总结矿床地质特征的基础上,对杨砦峪金矿S60深部矿脉进行碳-氢-氧(C-H-O)同位素特征研究,以探究成矿流体来源和成矿机制。H-O同位素测试结果表明,其δ18Oquartz值为9.8‰~11.5‰,平均值为10.71‰,δDH2O值为-56.1‰~-86.5‰,平均值为-68.02
“经济增长”作为现代经济学中最为重要的概念之一,并不是由马克思本人提出的,但在马克思的著作中却分散着很多关于经济增长的思想,这些思想贯穿于社会再生产理论的整个论述中。本文正是在阅读马克思相关著作的基础上,结合学术界现有的研究成果进行的理论探析。本文归纳梳理了马克思关于经济增长的相关论述,总结出马克思关于经济增长思想的理论框架,并在此基础上得到:经济增长归根结底表现为产出的增长,也就是由生产“生产资
<正>易货在日常经济生活中无处不在,它覆盖生产、流通、消费等多个环节,商品、服务、资产资源等多种门类。在“双循环”中发挥着重要作用。2022年4月,上海疫情封控期间,居民用12罐可乐一步步“换”出一个“小超市”,邻里互助成为“全民易货”的暖心诠释。放眼全球,2022年8月,浙江自贸区金义片区首单落地:货值293.8万元的8万余只铝锅换来尼日利亚等值铝锭。
期刊
本文分析“岗课赛证”融通趋势下学前教育专业声乐课程教学存在的主要问题,阐明学前教育专业声乐课程“3E”教学模式的内涵,论述运用“三步七环”的“3E”教学模式进行“岗课赛证”融通的学前教育专业声乐课程教学实践。
家校共育是一项重要的改革内容,中小学是学生发展的基础阶段,需要家长与教师的合力引导,以确保学生身心、智力、能力素养的全面发展。但从当前的城乡结合部中小学家校共育情况来看,存在很多不足,如家校共育开展不足、教育指导方式落后等,未发挥出显著的育人作用。基于此,本文对城乡结合部中小家校共育现状开展了全面的分析,结合课程改革视域,提出了几点有效策略。
期刊
目的:分析阴囊脓肿患者的临床特征与药学监护过程,为此类患者的抗感染治疗提供参考。方法:临床药师通过分析阴囊脓肿患者的临床特征,并根据微生物培养与药敏试验结果,协助临床医生制定个性化的用药方案,并开展药学监护。结果与结论:临床药师利用自身专业特长,协助临床医生开展个体化治疗,并成功将患者治愈出院,很好地体现了临床药师的价值。
超疏水材料是一种新型智能仿生材料,具有优良的自清洁、抗凝冰、防腐等性能,已广泛应用于航天、建筑、电力等领域。但在公路交通领域尚处于探索研究阶段。水泥基超疏水材料自清洁技术源于自然界的“荷叶效应”,超疏水表面的微纳结构和低表面能降低了污染物与涂层的粘附力,赋予超疏水表面优异的自清洁性,为水泥基材料的主动防污技术提供了新思路。目前,水泥基超疏材料自清洁理论与技术尚不成熟,主要通过表面微纳米复合结构和低
当下家庭和学校作为互补的两股教育力量常相掣肘,家校双方合作意识淡薄、职责不分、定位错乱、执行力弱等问题,从而导致家校共育难以开展。因此,家校协同合作的出路在于学校和教师更新理念,创新渠道,优化方法,搭建支点,以“校”促“家”,引领家校“联动”。