面向中文微博的情感分类方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:kuaiyu001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,微型博客(简称微博)越来越受到网络用户的青睐,成千上万的用户通过发布微博共享他们的观点和情感。其中,有大量带有情感倾向(认为某事物“好”或“坏”)的微博文本,这些微博文本反映了微博作者的情绪。一方面,微博渐渐成为研究意见挖掘和情感分析非常宝贵的意见资源;另一方面,微博也为意见挖掘和情感分析提出了新的要求和挑战。本文通过对新浪微博(目前最大的中文微博平台)文本进行情感信息方面的分析与研究,从以下两个方面对微博文本情感分类展开研究:  首先,本文提出了一种基于情绪知识的非监督情感分类方法。该方法利用情绪词和情绪图片两种情绪知识对大规模微博非标注语料进行筛选并自动标注,然后用自动标注好的语料作为训练集构建微博情感文本分类器,用以对微博文本进行情感极性自动分类。实验结果表明,我们提出的方法在微博文本的情感极性分类方面取得了较好的效果。  其次,本文通过对新浪微博上股票投资者发布的文本进行情感信息方面的分析与研究,提出了一种自动识别股票投资者未来情感倾向(认为股票市场未来行情“好”或“坏”)的方法。股票投资者未来情感倾向反应了股票投资者的情绪(InvestorSentiment),投资者情绪是研究经济市场走向的重要指标,行为金融学认为股票投资者情绪影响投资者决策,进而影响股票市场。本文提出的分类方法分为两级识别,第一级:识别出微博中包含未来情感的句子;第二级:将第一级识别出来的包含未来情感的句子分为正面评论(看涨)和负面评论(看跌)。实验结果表明,本文提出的方法同样取得了较好的效果。
其他文献
近年来,在计算机领域,智慧医疗逐渐成为了一个热门的发展方向。随着技术的发展以及人口的老龄化趋势不断加剧,越来越多的人选择在家中监控生理参数,各种家用医疗保健设备与服
脑—机接口(Brain-Computer Interface,BCI)是指在人脑和计算机或其他电子设备之间建立的直接的交流和控制通道。作为一种新颖的人机接口方式,脑—机接口使瘫痪的患者看到了与外
移动互联网的出现对于媒体行业来说无疑是一个新的契机,无论是传统的报刊企业还是门户网站,都推出了移动数字媒体客户端。本论文分析研究了当前市场上主流的数字媒体客户端系
解决Folksonomy存在垃圾标签的问题,本文提出垃圾标签检测模型。利用向量空间模型表征用户特征,再用支持向量机将Folksonomy用户二分类。通过检测出隐藏在正常用户群体中的垃
随着计算机技术的飞速发展,软件系统变得越来越复杂,测试技术是保证这些软件系统质量的常用手段,然而影响系统运行的因素有很多,因素与因素之间的交互作用也会影响系统的运行,人们
当前全世界的汽车工业都面临着石油资源短缺和环境污染的压力。为实施可持续发展战略,纯电动汽车已经成为了21世纪汽车工业的发展方向。纯电动汽车具有零排放、热辐射低和噪
随着互联网的快速发展,人们越来越多的社会活动发生在虚拟的网络空间。网络服务商为人们提供各式各样便利的网络服务,例如即时通信、网络支付等。但是目前,这些服务的身份认
目前随着计算机网络的飞速发展,涌现出了大量的对网络要求较高的多媒体实时业务,网络对QoS的需求也迅速提高,越来越需要对QoS具有较高支持度的网络。组播实现了同一信息从源
随着互联网的发展以及移动互联网时代的到来,为了应对大数据下的业务需求,集群的规模也在日益的变大,与此同时分布式系统的自动化部署和自动化管理的问题日益突出。尽管现在
随着GPS定位、无线传感等技术的发展与运用,以及具有定位功能的无线手持、车载设备的普及,使得基于移动对象的位置服务被广泛使用。移动对象的位置等信息随时间发生变化,数据