论文部分内容阅读
汽车用户满意度调查能发掘用户对于产品的潜在需求,帮助企业做出正确决策。如今网络上存在海量的用户发表的汽车评论数据,这些数据包含了用户对于汽车的使用体验及感受,对这些海量的在线评论进行挖掘及情感分析可以为汽车用户满意度调查提供理论依据及数据支持。然而,由于文本情感自身复杂抽象的特性,尤其是网络在线文本表达的不规范性及大量噪声的干扰,情感分析仍然面临着情感词库领域覆盖性差、情感特征提取困难及情感倾向分析准确度低等多个问题。 针对上述问题,本文以产品在线评论为研究对象,研究基于语料库的领域情感词库构建、融合情感信息与语义信息的词嵌入模型及基于情感词向量与长短期记忆网络的文本情感分析方法,最后将以上模型及方法应用于汽车领域,设计并实现基于情感分析的汽车用户满意度系统。主要研究工作如下: (1)基于点互信息及标签传播算法的领域情感词库构建研究。针对传统点互信息方法未考虑语料句法信息从而造成衡量情感词情感关联性存在误差的问题,在传统词共现的基础上,提出一种融合全局信息、局部信息及约束信息的点互信息方法,以更精确地计算情感词的情感关联值,并基于该关联值构建领域情感关联图;针对传统方法中情感值计算受种子词位置影响较大的问题,提出一种基于标签传播算法的情感值计算方法,以获取更高精度的领域情感词库。针对两种领域数据集的实验表明,所提出的方法能有效地提高领域情感词库的F值。 (2)融合领域情感词库的词嵌入模型及基于情感词向量与长短期记忆网络的文本情感分析方法研究。针对传统词嵌入模型在衡量词语相似性时存在词语语义相似而情感倾向不一致的问题,通过融合领域情感词库的方式引入情感信息维度,提出一种融合情感信息与语义信息的词嵌入模型,以提升词向量在情感上的表达能力;针对传统基于机器学习的方法忽略文本语义关系的问题,提出一种基于情感词向量与长短期记忆网络的文本情感分析方法,以充分利用文本深度语义信息,提升情感分析效果。针对词语级及文档级情感任务的实验表明,提出的词嵌入模型具有更强的情感表达能力,提出的情感分析方法能够有效提高F值。 (3)文本情感分析在汽车用户满意度上的应用研究。研究融合文本情感分析与Web技术的模块化分层架构,设计并开发数据采集模块、数据预处理模块及数据分析与统计模块,实现汽车用户满意度系统。系统以文本情感分析的结果为基础,可视化展示汽车用户对各型号汽车及汽车各属性的满意程度。在汽车用户满意度的应用中验证所提出模型及方法的有效性及实用性。