基于主题微博中群体情感特征的谣言检测研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:lpucicy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在资讯高速流动的今天,智能移动终端不断丰富,网络信息技术迅猛发展,微博等社交网络媒体已日渐成熟,并逐渐改变了人们的表述和生活方式。其不足140字的简短内容,满足个人碎片化倾诉与沟通的需求,不仅吸引了普罗大众,而且网罗了各界名流。微博信息丰富、传播迅速、影响巨大的特点,使其已经成为我国舆情爆发的主要策源地和传播媒介,甚至在重大灾难事件中扮演着灾难救援阵地的角色。与此同时,微博信息多样化、表达自由化的特点也造成微博空间谣言丛生,虚假信息层出不穷,营造了极不健康的网络环境。尤其在突发事件应急响应期间,微博中一条虚假信息的出现很可能破坏民众稳定的情绪,甚至影响灾难的救援。微博谣言检测技术就是一项能针对微博中的海量信息进行分析、识别和过滤的技术,能够及时发现和处理微博空间中的虚假信息和谣言。  传统的微博垃圾包括广告、恶意网站、水军账号以及谣言信息,本文更关注与新闻重大突发事件相关的微博事件谣言检测。所谓事件谣言,主要指以突发公共事件为背景,报道或者捏造与该事件相关的虚假信息。该类型的谣言会对国家安全和社会稳定造成更恶劣的影响。  对微博内容的研究,首要解决的问题就是数据获取。本文结合新浪微博API和网络爬虫技术设计了主题聚焦网络爬虫系统T-WeiboCrawler,采集了多个以热点舆论事件为背景的主题微博数据,其中包含一定数量的谣言微博。其次,大量用户情感信息集中在微博碎片化和离散化的文本内容中,如主题微博中的群体响应数据,包括转发微博和微博评论,对原内容起到了判别和辨识的作用。例如谣言微博与真实的新闻微博相比,转发和评论内容将表达出更多的质疑情绪。因此,可以通过情感分析方法提取群体响应中的情感特征,进而用于谣言检测。本文通过整理和拓展已有的情感知识库,从词、短语和语法层面上对微博文本内容进行了情感分析,实现了微博文本情感计算算法,并抽取了多种情感特征用于谣言检测研究。最后,根据传统的谣言检测研究方法,本文将谣言检测问题视为可信分类问题进行处理。在构建特征集合时,结合了传统常用特征和本文新提出的7种情感特征;在确定谣言检测算法时,本文选择的谣言检测模型是支持向量机(SVM)分类模型。针对以上三个方面的研究工作,本文均通过分析和实验,验证了上诉方法的有效性。
其他文献
当今社会是数字信息化时代,各种数字多媒体信息包括文本、图像、声音、视频等等在网络上广泛传播。但是网络上的信息很容易被随意复制及修改,侵权问题日益严重,各种信息的版权保
操作系统的安全对于计算机系统的安全具有举足轻重的作用。而在操作系统的诸多子系统中,审计系统又为最后一道安全防线。现有的审计系统主要可以分为两类:操作系统自带的以及
面向服务架构(SOA)的兴起为企业应用集成指明了新的发展方向,而企业服务总线(ESB)作为面向服务架构的最佳实现方式提供了服务集成的主要功能,如消息路由和数据格式转换等。服务路由
随着嵌入式系统软硬件技术不断的发展,它们的影响已经深入到社会的许多方面,也使得工业控制系统的结构发生了很大的变化。新的硬件平台和通信技术在变电站系统中应用,使得变电站自动化系统也得到了快速的发展。本论文主要就变电站自动化系统中保护监控平台的通信和设计等问题展开研究和探讨。本文首先回顾了变电站自动化技术的发展历程,论述了当前变电站自动化的现状及存在的问题,说明了新的硬件平台和快速以太网应用到变电站保
根据逆问题理论,本文利用旋转X射线造影数据进行基于运动补偿的三维冠状动脉重建算法研究。首先,本文对逆变换问题在有限维与无限维下的情况分别予以讨论。对于无限维情况,我们
警觉度是指人集中精力对刺激保持警惕并且维持一段时间的能力。在日常生活中,有时候我们需要维持一定的警觉度。譬如,驾车时我们就必须时刻保持清醒状态。所以,我们需要一种能够
随着控制系统应用领域的日益扩大,网络控制系统的研究越来越受到人们的广泛关注。网络控制系统的特点是参考输入、对象输出和控制输入等信息在控制系统各部件间(传感器、控制
随着一些新的控制器,如以ARM系列控制器为代表的RISC控制器的出现,使得DCS控制系统的架构设计有了更多的选择,新架构的DCS控制系统具有更高的稳定性和更高的性价比。 本文首
数据挖掘技术可以从大量数据中发现潜在的、有价值的知识。随着数据挖掘技术的迅速发展,聚类分析和孤立点检测技术已经广泛应用于模式识别、数据分析、图像处理、市场研究等
近年来,随着科学技术的快速发展,科学实验仪器和科学观测仪器的精度不断得到提高,领域科学家得到的可以用于科学分析的数据,其规模是不断变大;同时,由于科学分析的深度的不断