基于深度特征和加权word2vec融合模型的情感分析算法研究

来源 :西安科技大学 | 被引量 : 6次 | 上传用户:illuminate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线评价的文本数据中包含较为丰富的情感语义信息,可以帮助消费者了解产品信息、指导购买决策,并为商家改善各项服务提供参考。因此,准确挖掘在线评价文本中的情感语义信息具有较大的应用价值。然而,现有的文本分析方法较难充分挖掘文本中的情感语义特征和深度高层特征,会影响情感分类准确程度。为此,本文分别针对不同类型的短文本和长文本在线评价数据,提出了相应的情感分析算法,具体研究内容如下:(1)现有的短文本情感分析方法较难通过同时抽取短文本的情感特征和语义特征,改善短文本评价分类准确度。目前,基于情感词典的方法能够较为准确的提取短文本情感特征,word2vec算法能够很好的提取短文本的上下文语义特征。因此,本文提出了一种基于Sword2vec的短文本评价情感分析算法,能同时提取到短文本评价的语义特征和情感特征。该算法首先利用情感词典的方法提取短文本的情感特征,用word2vec算法提取短文本的语义特征;其次,利用情感特征对语义特征进行加权,得到文本的情感语义特征Sword2vec;最后,利用Sword2vec特征训练得到的模型对评价文本进行分类识别。实验结果表明,该算法相对于现有传统方法,在准确度和执行效率方面均有提升。(2)相较于短文本类型的在线评价数据,长文本类型的在线评价情感分析问题更为复杂。现有的长文本情感分析方法较难同时提取长文本评价数据的远近上下文语义信息、深度高层信息和情感信息,较难准确地刻画长文本的复杂特征。为此,本文提出了一种基于AttBiLSTM_Sword2vec的长文本评价情感分析算法。首先,利用情感值加权word2vec词向量得到情感特征和较近语义特征Sword2vec,并用基于注意力的双向长短期记忆力神经网络得到评价语料的深度特征和较远语义特征AttBiLSTM;其次,将Sword2vec特征和AttBiLSTM特征进行融合得到AttBiLSTM_Sword2vec特征;最后,利用AttBiLSTM_Sword2vec特征训练得到的模型对评价文本进行分类识别。实验结果表明,该算法能够同时提取并融合长文本评价的远近上下文语义信息、深度信息和情感信息,进而改善针对长文本评价的情感分析效果。
其他文献
目的观察靳三针疗法结合作业治疗对脑卒中后上肢功能障碍患者的影响。方法90例脑卒中患者随机分为对照组(n=30)、观察组(n=30)和试验组(n=30)。对照组接受常规康复,观察组在常规康复
分析回波损耗产生的原理,从回波损耗的定义,产生的原因及计算表达式3方面进行了介绍.然后使用Fluke DTX 1800测试仪对产生特殊电缆试验不通过的故障进行定位查找,找到故障点
采用Monsanto加工性能试验机,在T=90—135℃和(?)w=10—103s-1的条件下,考察了混炼胶在压出流动中的熔体弹性对过程参变量的依赖性。求得B={[△P/(4GL/D)+ξ2-1]×exp(-tR/τ)+
3月22日,北京市朝阳区妇联在京召开反家暴战略合作签约仪式暨婚姻家庭纠纷预防化解工作交流活动,深入推进婚姻家庭纠纷化解工作和反家暴工作。朝阳区各街道、地区(乡)妇联专
公共卫生专业学位硕士研究生培养必须坚持以社会公共卫生需求为导向,突出研究生的专业实践能力提升。通过梳理和分析当前公共卫生专业学位硕士研究生培养模式存在的问题,结合
随着印刷业数字化的不断发展,数字生产流程在报业的应用日益广泛,尤其是数字生产流程应用关键的CTP技术的成熟.目前,报业数字生产流程开始成为众多报业印刷厂关注的目标,安全
为了保证变电站能够正常运行,我们必须加强对变电设备的运维管理,采用多种有效运维管理方式,增强变电设备运维管理效 果。本文首先阐述了变电设备运维工作内容,其次分析了变
<正> 80年代以来,我国聚氨酯橡胶工业发展很快,生产能力已达3万t,但是与工业先进国家相比,尚有较大差距。具体表现在:聚氨酯橡胶类型结构不尽合理,仅限于几个基本品种,其总产
采用高分子设计,以n-BuLi为引发剂,环己烷为溶剂,二哌啶乙烷和二乙基锌分别作调节剂进行丁二烯阴离子聚合。在一定的实验条件下,分别合成了不同嵌段比和不同1,2-结构含量的1,
英国广播公司(以下简称“BBC”)于2016年播出的“丝绸之路”主题系列纪录片《丝绸之路》以古今丝路上的重要历史人物和事件为拍摄对象,根据不同的地理区域具体分为《中国段》