基于混合特征的假新闻检测方法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:szocean
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻是人们获取信息的重要途径,但是新闻中常穿插着假新闻进行传播。近年来随着互联网的发展,假新闻传播变得更加猖獗,因而假新闻检测成了一项迫在眉睫的研究任务。目前为止,共分四个方向对假新闻进行研究,分别为基于知识库、基于行文风格、基于立场以及基于传播途径。在社交网络上,假新闻为吸引流量和引导舆论方向,常使用有着明显差异的行文风格特征,基于这些差异性的行文风格特征已产出一定的研究成果,传统的基于行文风格特征的方法是将新闻文本作为一个文本分类问题,并将其拆分为特征工程和分类器两部分。而现有方法在特征工程构造过程中,存在以下两个问题:第一是对行文风格特征的选择不完整。现有做法,一般选择文本关键词和符号等部分行文风格特征,而忽略其他行文风格特征;第二是未考虑行文风格特征类型的多样性。行文风格特征类型繁多,每种特征对假新闻检测的重要程度都不尽相同,但是相关研究方法并没有考虑此类问题,而是直接使用统计学方法进行统计然后建模。这类模型虽然融合了行文风格特征进行研究,但是并不能发挥各种特征对假新闻检测的最大优势。目前为止,假新闻检测方法已取得一定研究成果,但是很少有检测工具落地。针对行文风格特征选择不完整的问题,本文采用统计学方法进一步挖掘了其他对假新闻检测有效的行文风格特征。针对未考虑行文风格特征种类多样性的问题,本文研究了各种行文风格特征的属性,并根据各自的属性将行文风格特征按词维度、句维度和篇维度进行分类,再结合文本语义信息来研究行文风格特征与假新闻之间的关系,提出了一种基于多维度行文风格特征的假新闻检测方法。在模型构建中,使用Text-CNN模型提取语义信息,加入Attention机制给各个维度的行文风格特征进行加权,以此来表示每种行文风格特征对假新闻的重要程度,使得更加合理的对假新闻进行预测。该方法在weibo数据集上取得较好的实验结果,F1值为86.95%。针对前序方法中存在的检测模型单一、句维度中没有考虑句子的上下文信息等问题,本文在基于多维度行文风格特征的假新闻检测方法的基础上,给出了基于混合特征的多通道假新闻检测方法。该方法借鉴了多粒度图片特征提取思想,将假新闻文本按字、词和句这三个粒度进行划分,然后使用多通道神经网络分别提取各粒度语义信息特征。在句粒度特征提取中,加入Bi-LSTM提取句子的上下文信息。然后使用基于DCA算法的融合方式将各粒度语义信息特征进行融合。该方法在weibo数据集上取得89.89%的F1值。针对假新闻检测工具落地不足的问题,本文在基于混合特征的多通道假新闻检测方法基础上,设计并实现了一个面向假新闻的自动检测工具。该工具使用基于Python的Flash轻量级Web框架进行搭建,并使用My SQL数据库进行数据存储。经过需求分析,主要设计四个功能,分别为假新闻检测、谣言线索提交、热点新闻展示以及其他辟谣平台入口。
其他文献
近年来,随着深度学习进入高速发展期,无人驾驶技术也开展地如火如荼,国内外各机构对无人驾驶技术进行了广泛的研究。车道线检测作为无人驾驶技术中的一项基础工作,对于无人驾驶技术的发展至关重要。虽然近年来车道线检测技术的研究已经取得了较大的成就,并且在一些场景下也能获得较好的检测结果,但是复杂环境下的车道线检测仍然存在着检测精度低,耗时长的问题,且一直是无人驾驶领域中的挑战与难点,这一难点也在一定程度上制
学位
电机消耗了全球35%-40%的电能和70%的工业用电。典型的工业应用包括:泵,风扇,传送带,磨粉机,离心机,压力机,电梯,包装设备和磨床。永磁同步电机是一种特殊类型的机器,通常用于高性能的应用。他们通过高密度的稀土磁铁,提供高功率和高效率。为了进一步提高电机的控制性能,节约能源成本,本文主要研究的是在矢量控制的基础上永磁同步电机系统中滑模变结构控制时的动态特性,本文的主要工作如下:(1)针对能够有
学位
高温隔热和抗热震长寿命是先进热障涂层追求的两个最重要功能属性,而涂层界面能累积引发涂层开裂和剥落,是涂层隔热和寿命的最基本破坏形式。本研究基于数值仿真和实验研究相结合的方法,阐明了导致涂层界面能累积的粘结层表面热生长氧化物(TGO)和表层陶瓷层烧结刚化两种破坏应力的来源,提出通过降低涂层内薄弱层间界面能量累积来延长涂层寿命,通过表面预处理显著降低粘结层TGO生长速度,同时,利用陶瓷涂层抗烧结结构设
会议
胶囊是医药行业不可或缺的重要产品,其质量直接关系到人们的生命安全。近年来,随着大数据、人工智能的快速发展,国内外对机器视觉的研究日渐成熟,一些基于机器视觉的胶囊缺陷检测设备相继出现。实现机器智能检测可以大大提高工业生产效率,节约人工成本。在机器视觉检测领域研究上,国内目前的检测技术水平明显略低于国外,但由于国外的检测设备售价昂贵,让国内很多中小型制药厂望而却步,这就给我国很多制药厂想实现传统到人工
学位
随着信息技术的迅速发展,产生了大量非结构化文本数据,其中隐藏了许多有价值的信息。信息抽取旨在帮助人们从海量数据中自动化抽取所需信息,因此这项技术可以运用到诸如经济、新闻、生物医学等具有大量数据的领域中。近年来,公开发表的生物文献呈指数级增长,面向生物领域的信息抽取研究与应用愈加迫切。然而,不同领域的文本特点存在明显差异,例如在生物文献中存在大量蛋白质、药物等专有名词,提取这些生物实体之间的交互关系
学位
随着卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉领域的快速发展,目标检测、目标跟踪等领域取得了重大进展,人头检测也广泛应用于生活中,如景区的人流量统计,地铁站、高铁站的客运量统计等。人头检测是行人检测的一种特殊检测方式,复杂场景下的行人检测存在着行人遮挡问题,如行人与行人、行人与物体之间的遮挡。众所周知,与人体的多变性相比,人体的头肩区域的形状变化
学位
在对儿童青少年的教育中,只有知识教育、技能教育和智慧教育是不完整的,还应有灵性教育。灵性生命教育应作为最高教育目标之一。本文通过临终关怀达成医学、心理学、教育三方整合的灵性生命教育模式。
期刊
<正>美术区域活动能让幼儿通过自身的操作与环境、材料、同伴互动,能让幼儿遵循自己的兴趣、意愿和能力,自主表达自己的想法与创意。所以,如何使美术区域活动真正成为幼儿解放天性、激发灵性、释放悟性的创意乐园,是值得我们探究的课题。一、巧创环境,解放天性,让美术有"趣"
期刊
近年来,随着经济的不断发展,用电需求也在不断扩大,煤炭等自然资源的消耗量不断增加,发展清洁能源被提上了日程,在此期间风力发电技术得到了极大的发展。三相电压型脉冲宽度调制(pulse-width modulation,PWM)整流器作为一种优秀的电能变换器,具有低畸变率且可调的直流电压等特点。PWM整流器电网侧的常用控制策略为以直流电压为外环、交流电流为内环的双闭环控制结构,传统的PWM整流器的双闭
学位
毒品成瘾是一种慢性、复发性的脑部疾病,已成为严重危害人民身体健康和社区安定的主要因素之一。对患者吸毒成瘾尤其是对复吸问题的防治,目前尚未具有行之有效的方法。磁共振成像(magnetic resonance imaging,MRI)技术是研究成瘾的主要手段之一,但现有研究大多数集中在利用单模态磁共振图像去探索成瘾脑结构或功能的变化,如何充分结合多模态影像信息,找到可靠的成瘾影像标记是未来研究的主要趋
学位