基于评论情感的微博谣言检测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:suriq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以微博为代表的社交网络的兴起,在带给人们前所未有的资讯体验的同时,社交网络中层出不穷、愈演愈烈的谣言信息也成为日益突出的问题。谣言的自动检测研究作为社交网络谣言研究、监控、应对和治理的前提,正逐渐受到关注。  本文以流行的中文社交平台——新浪微博为背景,以微博谣言为研究对象,在前人将检测任务作为分类问题求解的框架下,重点关注于微博评论中的情感反馈,提出将评论的总体情感正负倾向作为一项新的特征,用于谣言检测的分类任务中。总体说来,本文工作主要体现在以下两个方面:  (1)本文为实验所需从官方公示中爬取了高质量的谣言样本,同时爬取分布覆盖比较广泛的普通微博数据,构建起微博语料集。由于本文从真实微博环境中爬取的数据中大量存在的垃圾评论噪声会对实验结果产生较大干扰,本文在数据的预处理阶段重点对垃圾评论进行分类过滤。通过预处理,大大地减少了语料中的噪音,为实验能够有效验证打下良好基础。  (2)造谣者在炮制谣言时的刻意为之,加之谣言在公共参与讨论中必然招致的质疑批驳,都使得谣言微博的评论总体上比普通微博更倾向于负面情感。因此本文提出了一种利用微博的评论总体情感倾向的特征,并利用基于词频特征的分类器对单条评论进行情感倾向的有效识别,从而得到总体情感倾向特征值。最后在微博语料库上实验验证,表明本文提出的新特征在现有特征基础上对分类结果有可观的提升。
其他文献
学位
视频监控系统是如今广泛应用于人们工作和生活中的监控系统,随着现代科学技术的飞速发展和人们生活质量的提高,传统意义上的视频监控系统已经越来越不能满足人们更高的要求。
物联网是新一代信息技术的重要组成部分,其应用范围几乎覆盖了各行各业。物联网获得广泛应用需要解决的一个关键问题是物联网中间件中的信息处理部分,而复杂事件处理是物联网中
云计算是信息时代高速发展的必然产物,作为继个人电脑和互联网之后的第三次IT产业革命,凭借其灵活方便的资源交付模型,改变了公众对计算能力的获取方式,同时其强大的融合和调配能
Android系统作为2008年才发布的开源手机操作系统,因为其免费和开源的特性,迅速流行开来,市场占有率已成为第一,不论是价值千元的低端机还是四五千的高端机,都随处可见。其易用性
近年来,电影产业的发展越来越受到人们关注,每年都有数以百计的电影上映。由于可以选择的影视节目太多,用户很难找到自己感兴趣的节目,如何让用户在短时间内从大量影视剧中找
基于视频的移动目标检测是图像处理的一个重要分支,在许多实际应用中担当核心的任务。理想情况下运动目标检测算法是基于静态背景的,但在实际应用中,运动目标所处的场景往往
随着大数据时代的到来,爆炸式增长的海量数据迫切需要有效的存储和管理。大规模分布式存储技术的飞跃式发展势不可挡。人们对存储系统的要求也更为广泛,譬如存储容量、I/O性能
随着大数据技术在业界和学术界的发展,大量的分布式计算平台投入运行,其中以Apache Hadoop平台应用最为广泛。Hadoop屏蔽了分布式系统的底层实现细节,使得应用程序开发人员可
随着网络和信息技术的发展,不同组织域之间的信息共享和分布式协作变得日益广泛。一方面为现代社会生产和生活提供了很大便利,而另一方面,又会带来各种信息安全问题。各个组织域