微博新闻话题的情感分析研究

被引量 : 0次 | 上传用户:liveonmountain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前微博已经成为人们发表意见、表达情感的最重要的一种渠道,微博中产生的大量带有情感的信息,反映了人们对热点事件、热点话题的褒贬倾向。因此对微博中这些情感文本进行挖掘和分析已经成为当前的一个研究热点。本文通过话题识别技术和情感分析技术对微博中的新闻话题进行分析。使用话题识别技术从海量的微博数据中发现热点新闻话题;并与情感分析技术结合,分析监测热点话题的情感极性和情感强度,及时把握广大网民对热点话题的看法和评价,可以有效的帮助政府职能部门了解民意,便于决策者做出决策。针对传统的话题检测算法主要适用于新闻网页和博客等长文本信息,而不能有效处理具有稀疏性的微博数据,给出一种基于词共现图的方法来识别微博中的新闻话题。该方法首先在微博数据预处理之后,综合相对词频和词频增加率两个因素抽取微博数据中的主题词;然后根据主题词间的共现度构建词共现图,把词共现图中每个不连通的簇集看成一个新闻话题,并使用每个簇集中包含信息量较大的几个主题词来表示微博新闻话题。最后在微博数据集上进行实验,实现了对微博中新闻话题的识别,验证了基于词共现图方法的有效性。针对微博的情感分析研究得到了越来越多的关注,本文根据中文微博的特点,给出了一种基于语义规则的方法对微博热点话题进行情感分析。这种方法首先需要人工整理出程度副词表,否定词表和微博中默认表情符号的褒贬分类;然后在情感词语计算的基础上,考虑上下文中否定词和程度词对修饰情感词语的情感倾向和情感强度的影响,同时也设定规则计算表情符号对一条微博的情感倾向判断的作用。最后把基于语义规则的方法与基于情感词典的方法做了实验对比,实验结果表明基于语义规则的方法是有效可行的。
其他文献
文章介绍了作者2007年在哈佛大学燕京图书馆、美国国会图书馆、哥伦比亚大学东亚图书馆的考察见闻。这几大图书馆对地方志的收藏都很有特色。不仅仅是藏书量大,而且其中不乏
目的对医院门诊药房药品服务部处方进行点评与分析,为临床合理用药提供参考。方法依据处方点评指南,采用回顾性分析方法,对医院门诊药房药品服务部2013年1月至7月的处方进行
近10多年来,无线传感器网络由于其巨大的应用潜力和广阔的发展前景,始终是学术研究的热点问题。无线传感器网络与传统计算机通信网络的显著区别是其所具有的信息感知能力,从而将
目的利用近红外光谱(NIRS)快速测定复方阿胶浆中总黄酮、总皂苷和可溶性固形物。方法采用比色法测定复方阿胶浆中总黄酮和总皂苷的量,采用水分测定仪测定可溶性固形物的量,作
当前,高等教育已经由注重规模扩张转向关注质量内涵的提升,这需要高等教育的各个构成部分在认真反思的基础上做出科学的应答,体育教育工作亦然。在新的历史时期,高等体育教育应该
<正>提高学生的化学问题解决能力是化学学习的重要目标。然而,实践表明,中学生独立解决化学问题的能力并不令人满意。这突出表现在以下几个方面:同一类型的问题,即使是接触过
机载通信系统的高速发展,通信环境的日趋复杂,对构成系统的元器件提出了种种更加严格的要求。天线作为不可缺少的前端部件,其隐身性能开始越来越受到重视。所谓天线隐身,是指对探
随着局域网应用的越来越广,各个单位基本上都拥有自己的内部局域网,给网络办公的实现提供了硬件平台保障。很多单位为了利用好优良的网络条件,提高办公效率,实现网络办公自动化,尝
文章以明末清初《松江府志》的编纂为例,阐明地方志的编纂深受社会变动的影响,具有因时而变的特点。明末,由于中央政权的式微,松江士绅在编纂地方志时有较大的自主空间,可以
随着汽车行业的快速发展,汽车在全球范围内的普及率持续增高。特别是在我国,汽车销售量呈每年稳健递增的趋势。汽车座椅是为乘客提供驾驶舒适性的重要组成部分,也是人和汽车接触