面向微博事件的民众情绪分类及原因分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shuwenglei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体特别是微博的飞速发展,越来越多的民众开始习惯于在互联网上发表自己对于热点时事的观点。如何充分利用这些海量的关于热点事件的数据,对热点事件及其中的民众舆论进行深入的分析,成为了一个非常有意义的课题。本文就针对这一课题做了深入的研究。对热点事件的微博数据进行情绪分类,已经成为研究人员分析热点事件及民众舆论的一个重要手段。本文的研究正是围绕着微博情绪分类展开的,本文分别从提升微博情绪分类效果,以及微博事件情绪的原因分析两个方面开展了深入的研究工作。关于提升微博情绪分类效果,本文就两个角度提出了改进的方案,并进行了相关实验验证。它们分别是:微博情绪分类中存在的将立场类微博与情绪微博混淆的不足问题,以及在对微博进行情绪分类时未考虑用户历史信息的可改进问题。关于第一个不足问题,本文采取在情绪分类之后添加立场类与情绪类微博再分类算法的方式进行改进,而对于后者,本文通过将用户历史微博信息加入到现有的情绪分类算法中,通过实验比对验证了加入用户信息的可行性。关于微博事件情绪的原因分析,本文也分别从情绪分布与情绪拐点两个方面进行了研究与分析。本文首先定义原因分析,实质为提取微博事件中与情绪最为相关的原因子事件的过程。由于提取子事件的过程需要在事件中进行子事件聚类,而在若干子事件中提取最为相关的原因子事件则需要进行文档排序。所以本文分别进行了子事件聚类、原因子事件排序两个部分的研究与实验,均获得不错的效果。
其他文献
现在每天都有大量数据需要提取和分析,数据挖掘技术在许多实际应用中获得巨大成功,分类模型已经在许多应用场合得到广泛应用,如原油泄漏检测、信用卡检测、医疗检测等等。由
随着大数据时代的到来,海量数据在企业以及人们的日常生活中都有广泛的应用。数据质量对数据的应用效果起着至关重要的作用,其中数据时效性问题是数据质量的主要影响因素之一
近年来随着电子商务的蓬勃发展,作为电子商务基础的电子现金领域的研究得到了国内外科研人员、工程技术人员的广泛重视。作为一种新兴的以电子(或数字)模拟真实货币的技术,电子
随着电力调控系统的服务范围不断扩大,数据来源增多,数据类型多样,数据规模和处理压力急剧增大,调控业务对海量多源数据分析处理的要求不断提升。本文面向电力调控系统大数据
随着半导体技术、微系统技术、嵌入式技术和无线通信等技术的高速发展,使得微传感器节点的处理能力更强、功能更丰富、体积更微型化,能够集信息采集、数据处理和无线通信等功能
随着电信市场的迅速发展,目前我国通信设备的覆盖率已到达了很高的水平,手机用户的数量逐年增加。电信运营商要保持市场的高效运作,必须依据不同地区,根据不同的人群来划分不
三维编织复合材料具有优越性能,广泛应用于航天、航空、交通、汽车等领域。研究三维编织复合材料内部特征状况、材料力学性能及微观变形,对于该材料的应用设计和编织工艺改进具
频繁模式挖掘的目的是从数据中找出出现频率较高的内容,它是数据挖掘领域众多研究方向中最重要的其中一个。按照数据集的不同,频繁模式分为频繁项集和频繁子序列。由于挖掘频
由于IPv4的地址资源在2012年左右将要耗尽,以及现有的基于IPv4的网络对流媒体、安全性等的支持不够,所以IETF很早就制定了下一代网络协议IPv6。IPv6吸收了IPv4的优点并在此基础
随着互联网的快速发展,语义Web服务将成为下一代网络计算的重要发展方向,基于语义的Web服务发现是语义Web服务中的研究热点之一。目前,语义Web服务发现的研究大多数是基于同