基于立场挖掘的微博谣言检测算法的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lmaster
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web2.0时代的到来,社交媒体开始在社会生活中流行开来。作为社交媒体的一种,微博依靠其巨大的用户基数和强大的用户粘性成为了当下社会的重要信息源。巨大的用户基数和快速的信息传播速度使得微博平台的谣言能够对公共安全构成极大的潜在危害。适应微博平台的特异性,探究出针对微博平台的谣言检测方法具有重要的现实意义。为了实现微博平台的谣言自动检测,大量的谣言检测方法被提出。已有的谣言检测方法主要分为基于特征集的检测方法和基于深度学习的检测方法两种。基于特征集的谣言检测方法需要人工抽取特征集,人工成本巨大,且无法有效抽取高维抽象特征;基于深度学习的谣言检测方法则没有充分利用到立场信息对谣言检测的指示作用。立场信息是重要的谣言检测特征,根据现有的研究,和真实话题下的用户立场相比,谣言话题下的用户更倾向于持有质疑和反对的立场,这是群体智慧的体现。为了充分利用用户的立场信息,本研究首先进行了基于统计的和基于特征集的立场信息有效性的验证。基于统计的立场信息的有效性验证通过对真实数据进行统计分析,得出立场信息在谣言和非谣言事件中的分布是不同的,进而得出立场信息可作为谣言检测的特征的推断;基于上述推断,本研究又提出了包含立场特征的特征集,和不包含立场特征的特征集进行基于SVM的谣言检测性能对比,实验验证了立场信息的有效性。经过立场信息有效性验证后,本研究着手进行了基于立场挖掘的微博谣言检测算法的研究与实现。首先提出了基于CNN-GRU的立场挖掘模型,充分提取微博文本中的语法立场特征和事件相关立场特征;然后在立场挖掘模型的基础上提出了通过构建混合特征向量进行立场挖掘的融合立场挖掘的微博谣言检测模型,此模型充分挖掘了立场特征和谣言特征,并提出了合理的整合方式构建混合的特征向量,实现了高效的谣言识别。最后,为了更有效地利用立场信息中的高价值信息,提高谣言检测模型的性能,本研究又提出了基于混合立场注意力的微博谣言检测模型,通过引入Attention机制,提高谣言检测模型的性能。基于CNN-GRU的立场挖掘模型和现有的立场挖掘模型相比,在异事件立场挖掘实验中获得了更优的性能;融合立场挖掘的微博谣言检测模型与基于混合立场注意力的微博谣言检测模型和现有的谣言检测模型相比,拥有更优的谣言检测准确率和更好的早期检测性能。
其他文献
中国“一带一路”倡议提出后,得到国际社会广泛关注。目前,参与共建“一带一路”的众多国家间,经济和政策协调不断加强。因此,对参与成员国的时空格局也产生着多维度的影响,时空格局是反映一个区域发展演变的重要研究方法,所以本文对“一带一路”倡议下参与国的时空格局变化开展研究具有较大意义。从经济上看,越南是中国“一带一路”成员国中,对外贸易额最多的国家。从地理位置上看,越南是与中国“一带一路”陆海都相连的国
我国从20世纪90年代起开始引入政府绩效管理。政府绩效管理作为行政管理的有效工具,对于政府部门及国家工作人员的规范化管理、持续推动机关作风的转变和效能的提升具有重要作用。税务部门对于绩效管理工作的重要性非常清楚,在日常管理中,绩效管理一直是不可或缺的一个环节。本文根据新公共管理、委托—代理理论,以及关键绩效指标法、平衡记分卡法等政府绩效管理的方法,采用文献法以及实地调研法等方法,对税务系统绩效管理
作为市场活动的主要参与者,企业是市场经济中最重要的市场主体,而其中,中小企业占据了绝大部分,中小企业在稳定增长、调整结构、扩大内需等方面发挥着不可或缺的作用,其发展程度很大程度上决定了现代化经济体系的水平。但由于我国市场经济体制还不够完善,市场在资源配置中起决定性作用发挥还不够充分,加之在经济下行压力和新冠肺炎疫情的影响下,中小企业受到自身发展阶段和能力条件的限制,做好中小企业服务工作成为地方政府
本文研究的是一种多水下无人航行器编队队形动态重构方法,水下无人航行器(Unmanned Underwater Vehicle,UUV)是一种拥有较强自主能力的水下无人作业装置,在民用领域中,可以用来进行海洋资源探索、海底地形勘测、海洋搜寻救援等多种任务;在军用领域中,可以代替载人潜器进行侦查、搜寻甚至攻击等任务。随着时代的发展和相关技术的进步,现代海洋探索任务越来越复杂,只依靠单个UUV来完成相关
隐喻在日常生活中随处可见,认知语言学研究表明隐喻还是一种重要的认知方式。随着人工智能话题的不断升温,自然语言处理研究也成为学术界和工业界共同关注的热点领域。而隐喻的计算化研究正逐步吸引自然语言处理领域学者们的关注,它也是自然语言处理研究中不可回避的重要问题。近些年来,深度学习方法发展迅速,深度神经网络在特征学习上具有明显优势,鉴于此,本文主要是基于深度学习的方法对隐喻识别和理解问题进行研究。首先,
近年来,交通拥堵问题愈发严重,为减少交通拥堵带来的经济损失及社会影响,利用智能交通系统(ITS)管理和改善交通是十分必要的。交通流量预测是ITS的基础,它通过分析历史交通数据预测未来的交通状况。准确、实时的交通流量预测不仅为相关部门的管理提供了科学依据,而且提高了公共出行的效率和安全性。交通流量数据具有复杂的时空依赖性,这对于其准确的预测具有挑战性。目前,大多数方法都是基于交通流时间序列特征信息进
本课题以研究龙胜地区的红瑶少数民族的博物馆文化创意产品的设计为主要内容。从国内外的博物馆文创产品的开发现状与发展过程中所面临的问题入手,论述地方博物馆民族文创产品开发的重要性。国内外很多博物馆也都越发注重文创产品的开发设计,一些知名度较大的博物馆已开始着重打造自身的IP形象。而我国的博物馆文创事业起步稍晚,与国外的博物馆文创产业还是有一定差距。我国少数民族众多,文化资源丰富。地方博物馆作为当地历史
近年来,随着社会的发展,半导体器件在各行各业都起到了重要的作用,然而,传统的Si基器件受其材料性能极限限制已逐渐不能满足人们的需求,目前越来越多的研究在于开发替代材料来进一步提高器件的性能。其中,Ga N材料由于其具有高电子迁移率、高击穿场强、高工作温度等方面优越的材料性能,成为了研究热点之一。Ga N基器件在许多发达国家都被列入了重要的战略研究计划,其市场占有量增长迅猛,未来发展无可估量。相对于
哺乳动物早期胚胎发育是一个十分复杂的生物学过程,该过程包括卵母细胞受精直至发育到囊胚的整个阶段。随着科学和医学领域的发展,哺乳动物早期胚胎发育过程也逐渐成为了众多科研工作者们关注的焦点,哺乳动物早期胚胎发育机制的研究对医学领域中辅助生殖的发展具有良好的推动作用。猪在免疫学和生理学上与人类相似,早期胚胎发育机制也和人类相似,所以猪早期胚胎发育机制的研究对医学及农业发展具有重要意义。近年来,长非编码R
新形势下企业面临的竞争环境错综复杂,制约我国众多企业营业利润提升和经营管理效率改善的深层次问题依然突出,其中资本结构被认为是有效改善企业营业利润和管理效率的有效途