基于词向量与词性的情感分析算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zxzcmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析用来研究人们对周围事物、事件的观点和看法。微博作为一种交流工具,引起了国内外专家学者的高度重视,对微博数据的情感分析是一件非常重要而有意义的事情。传统的情感分析一般基于情感词典,但这种方法一方面忽视了非情感词语对情感分析结果产生的影响;另一方面传统的语义模型无法存储词语的语义信息,因此也无法对情感分析进行准确分类。论文针对上述问题,提出了一种新的情感分析方法,即基于词向量与词性的情感分析算法SA2-WV&POS。论文主要工作如下:(1)在实验预处理阶段,针对使用情感词典进行情感分析时无法准确分类的问题,论文首先用词性过滤方法对实验数据集进行预处理,算法在充分考虑情感词的基础上,考虑了非情感词语对情感分析产生的影响。(2)在特征提取阶段,论文针对传统语言模型无法存储词语语义信息的问题,利用Word2Vec将词语映射到向量空间,转换成词向量。SA2-WV&POS算法将TF-IDF特征提取方法与词向量相结合,既充分地考虑了词语的语义信息,又可以控制词向量的维度。SA2-WV&POS算法充分考虑了词语词性及语义信息对情感分析结果的影响,将TF-IDF特征提取与词向量相结合,生成特征词向量。经实验验证,该算法明显地提高了实验的准确率、F值等评价标准,取得了较好的情感分类结果。
其他文献
[目的]探讨中医治疗脑肿瘤有效途径。[方法]对133例临床明确诊断为脑肿瘤手术后或手术+放化疗后患者采用以熄风清热、化痰散结、祛瘀通络为主。佐以滋补肝肾中草药治疗。[结
<正>目前临床应用单一炎症介质拮抗剂治疗支气管哮喘(简称哮喘)的疗效并不十分理想,由于哮喘的病因复杂,个体对药物的反应有差异,即使联合用药也难有较好的疗效。我们于2002
会议
《春秋》经、传各有自己的材料来源。古代史官通过“承告”和“传闻”两种方式获得信息 ,所谓“承告”是指别国史官的正式通报 ,构成官方史录 ,它遵守巫史传统的表达方式 ,所
本文按照金盾工程的总体设计原则,结合多层结构的设计理念,系统的总体架构按照七个层次进行设计,分别为数据存储层、数据抽取整合层、基础业务组件层、自定义考评及工作流管
<正> 迄今为止,文学艺术作品中出现了四个影响大的潘金莲,她们是:大作家施耐庵的《水浒》中的潘金莲,怪作家笑笑生的《金瓶梅》中的潘金莲,前辈剧作家欧阳予倩的话剧《潘金莲
<正>修璐(建设部执业资格注册中心副主任):我仅代表全国城市规划执业制度管理委员会和建设部执业资格注册中心,将全国城市规划师执业资格制度实施情况向大家汇报一下。1.城市
城市更新会带来土地使用的两种基本变化:①土地使用功能和土地使用性质的变化;②土地开发强度的变化。这两种变化进而派生出土地使用其他方面的变化:人口特征、资金流、信息
通过对清江流域复杂的地质构造条件和河流水文特征进行概括,从流域水文地貌系统的角度分析了该地区最具特色自然景观的形成机制。阐述了峡谷、石柱式峰林形成的主要动力和控
<正>集团党委书记薛荣是一名军旅子弟,自幼受革命家庭熏陶,对党和国家有着深厚的感情。出于对党的深厚情感,2002年还不是共产党员的她,积极支持自己亲手创办的圆方公司成立党
目的:探讨不同鼠龄的大鼠骨髓间充质干细胞移植对急性心肌梗死动物心脏血管再生及心功能的影响。方法:密度梯度离心法和贴壁筛选法获得SD大鼠骨髓间充质干细胞,体外模拟梗死