基于微博的细粒度情感分析

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:kantstop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】对微博进行细粒度情感分析,将情感分为8类,并计算其情感强度值,从而尽可能还原微博用户情感。【方法】通过微博语料分析构建疑问词词表,在大连理工大学情感词汇本体DUTIR的7类情感基础上,丰富一类情感"疑",并利用点互信息法构建表情符号词典,还综合考虑否定词和程度副词对情感表达的影响,利用Python从新浪微博上获取数据,并用R语言的jieba R包进行分词,对情感进行分类并计算其强度。【结果】得到微博用户对于糖尿病7类常用药物的8类情感占比及情感强度,并通过正确率、召回率、F值对结果进行验证,其中"怒"和"哀"的正确率最高,分别为85.73%和83.05%,而"乐"和"好"的召回率与F值均最高,为81%以上。本文新增情感"疑"的正确率、召回率、F值分别为77.33%、78.58%、77.95%,均值在8类情感中排名前列,说明其情感识别较好。【局限】由于本文依赖于情感词典进行情感分析,因此为了更好的分析结果,情感词典仍需进一步完善。【结论】本方法具有较高的识别率和可靠性,能够更好地对微博上的情感分类进行细粒度分析。
其他文献
<正>说到家具行业,绝对离不开业界精英的支持和引导作用。而家具行业快速发展的30年,更是特色分明。分析2013上半年中国家具市场形势,可以明显看出我国家具市场的"变革"特点
在路桥施工过程中,经常会产生一些病害。导致病害产生的原因包括:人为因素、自然因素及施工过程中的管理失误等。为了确保路桥施工的质量,论文就路桥施工中病害产生的原因进
随着互联网的日益普及,尤其是Web2.0的不停的发展,用户的参与度大大提高,互联网上产生了大量对诸如人物、事件、产品等具有情感倾向的评价性信息。网络传媒中的情感词语的强
随着网络的发展和智能设备的普及,人们越来越多地在网络中发表自己的言论和观点,因而产生海量的用户生成信息(User Generated Content,UGC)。如何对UGC中短文本信息进行挖掘
[目的 /意义]对细粒度情感分析研究进展进行调研和总结,探讨其关键问题、关键技术及未来研究趋势。[方法 /过程]采用文献调研方法,从不同粒度层次的情感分析视角,对粗粒度情
消费者在购物网站上发表的购后评论既包含对产品的总体评价,也包含对产品某些特征的评价,如何从评论文本中挖掘出细粒度情感信息是消费者和企业亟待解决的问题。从中文产品评
结合耐石油腐蚀含铝钢在我国的应用情况及国内外焊接接头中碳迁移问题的最新研究进展,从碳活度角度探讨了含铝钢焊接接头中碳的扩散过程、脱/增碳层的产生机理,提出了抑制其
谣言是信息不透明的产物,“三人成虎”,“双兔傍地走,安能辨我是雄雌?”但在天下互通互联的互联网时代,谣言不但没有减少,反而越来越兴盛,这背后的奥秘耐人寻味:$$   谣言不仅是一
期刊
随着知识经济时代的到来以及经济全球化步伐的不断加快,我国制造型企业面临的内外环境也发生了根本性的变化。内外环境的变化不仅给企业带来了机遇,同时还带来了挑战,于是如
对素质教育的辩证思考梁冲珍任何时代的教育思想、教育理论,作为社会意识的组成部分,都由社会存在所决定。马克思说,“不管是人们‘内在本性’,或是人们对这种本性的‘意识’,即他