【摘 要】
:
随着互联网的高速发展,微博凭借其实时、简捷的优点逐渐成为公众传播消息、发表观点、分享状态的舆论平台。在其基础上的情感分析和预测也逐渐为当前的一个热门研究领域。分
论文部分内容阅读
随着互联网的高速发展,微博凭借其实时、简捷的优点逐渐成为公众传播消息、发表观点、分享状态的舆论平台。在其基础上的情感分析和预测也逐渐为当前的一个热门研究领域。分析事件的在微博虚拟世界的情感,可以了解公众对于真实世界中相关事件的公众情感趋向,对于舆情分析和监测,甚至商业产品优化和营销都有重要意义。微博具有特征稀疏和上下文缺失的特点,当前情感分析方法对于不含明显的情感词和语义特征标识却具有隐含情感的短文本不能很好识别。因此,本文从认知学和统计学角度出发,结合机器学习和人工标注方法构造情感常识库,并将其作为上下文背景辅助微博情感分析,进而预测事件情感趋势。1)情感常识库包括结构化常识和非结构化常识两部分。情感图式作为结构化常识知识,是在认知评价理论的基础上,结合语用推理和模式匹配方法构造而成。二元情感常识作为非结构化常识,使用依存句法分析技术挖掘句法结构构造而成;在规范文本句子级情感分析中的实验表明:两者可以有效提高情感分析准确率。网络俗语也是一种包涵网络背景知识的非结构化情感常识。本文采用互信息、上下文熵以及词向量word2vec技术挖掘网络俗语并进行情感判断。2)在情感常识库基础上,提出规则匹配和统计分类方法相结合的双层分类模型。在微博细粒度情感分析实验中,相对于当前基于词典和语义特征方法以及统计分类方法,准确率有明显提升。结合微博发表时间进行微博情感时序分析,预测事件不同时间段的情感比例。通过与百度指数用户关注度曲线对比表明情感趋势预测符合事件的真实发展状况,达到了实验预期。综上所述,本文构造的情感常识作为一种具有一定普适性的语义资源可以有效应用于情感计算领域,辅助进行文本情感分析和趋势预测。
其他文献
近年来,糖尿病患病率和糖尿病患者数量急剧增加。糖尿病及其并发症给人类健康和社会发展带来了严重的负担。在我国通过流行病学调查,估计20岁以上的成年人糖尿病患病率为9.7%。
目的:分析1993~2000年上海市黄浦区妇科疾病普查情况和疾病,以利更好推动妇科疾病普查工作的开展。方法:对上海市黄浦区经审批合格的普查队开展妇科疾病普查后上报上海市黄浦
不同的文体有不同的翻译策略,同时与文体的结构也有莫大关系。新闻是一种特殊的文体,其独特的文体结构会对翻译造成怎样的影响,笔者将探究两者之间的关系。
通过开发的有机镀膜技术,选用具有不同功能基团的有机镀液对不锈钢表面进行改性。借助于红外光谱、接触角和表面自由能等测试对有机镀膜处理的不锈钢表面薄膜进行了表征。实验
杨桃属杨桃科杨桃属植物,原产于亚洲东南部,主要分布于东南亚,我国广东、广西、云南、福建、海南、台湾等省(区)均有种植。随着杨桃栽培面积的不断扩大,杨桃赤斑病给杨桃造成了严重
头孢呋辛(Cefuroxime)为第二代头孢菌素,可供临床应用的剂型主要有注射剂和口服剂型,其成份分别为头孢呋辛钠(Cefuroxime sodium)和头孢呋辛酯(Cefuroxime axetil).头孢呋辛
随着我国互联网的飞速发展以及网民人数的不断增加,网络语言在人们的社会语言生活中提供了诸多便利的同时,也出现了很多语言失范现象,这在一定程度上对我国当前的语文教学、
目的基于新的紫外检测方法来确定知母总皂苷的最佳提取工艺。方法通过优化显色剂和显色参数,建立知母总皂苷的最佳检测方法,并以总皂苷提取效率为指标确定最佳提取工艺。结果
会计职业道德作为一种引导、制约会计行为,调整会计从业人员与社会、企业单位和不同利益群体以及会计从业人员之间关系的职业行为准则和规范,在社会主义现代市场经济的今天尤
老舍在20世纪三四十年代创作的小说,对北京老派市民身上落后的文化积淀所造成的庸俗心态的揭露,对中产阶级在生活的压迫下产生的病态心理的批判,以及对新派先觉知识分子的忏