面向电子商务评论文本的情感分析技术研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:jhf44623386
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务对人们生活产生深刻的影响,面向电子商务评论文本的情感分析研究也成为当前的热点研究方向。评论文本情感分析方法主要分为基于情感词典的方法和基于机器学习的方法,然而传统的情感分析方法面对电子商务评论文本时在特征表示及提取等方面存在诸多不足,而丰富有效的特征提取是提升情感判别准确率的关键因素。为了解决传统情感分析模型在处理电子商务文本时特征构建与使用方面存在的问题,本论文针对传统情感分析方法提出了两种改进模型并在真实的中文电子商务评论上进行试验,验证了我们提出的改进方法的有效性。本文的主要工作有:第一,通过对情感词典采用模板匹配的方式进行扩展和针对不同句型针对性分析评论语句情感值的计算方法,建立了基于情感词典的改进分析模型。本文首先对现有情感词典进行了收集和整理,同时对网络词典进行收集并采用基于模板规则的方法对情感词典进行了拓展,获取领域情感词,构建了面向电子商务评论的情感词典。其次,本文引入决策树对不同句型进行分类,将句子分为四大类,包括肯定句、否定句、双重否定句及反问句,然后针对每类句型设计情感值计算方法,并对双重否定句以及反问句这两类情感强度较强的句子做加权处理,实现整条评论的情感值计算来获取其情感倾向性。最后,通过在京东部分商品评论数据上的实验证明了改进模型的情感判别效果明显优于传统模型,充分体现本文提出的改进模型的有效性。第二,通过融合词向量特征建立了基于机器学习的改进分析模型。传统的基于机器学习的分析方法对于评论这样的短文本进行特征表示时,存在特征稀疏问题。词向量技术能实现文本的向量化表示,向量维度较低,并能有效对词语之间的语义关系进行建模。为了提取更为丰富准确的文本特征,我们在第一部分拓展的情感词典的基础上基于词向量技术对情感词的向量表示进行情感调整构造情感词向量,并利用TF-IDF值表征词在文本中的重要性,作为词向量的权重,最后将词向量进行加权叠加,形成文本的向量化表示。在此基础上,将第一部分中基于情感词典的分析模型输出作为特征与本部分中的情感词向量特征进行融合,并通过机器学习方法进行情感分析。实验结果表明,改进的基于机器学习的情感分析模型相比其它基础模型在性能上有进一步提升。
其他文献
对于刑事诉讼的基本原则——疑罪从无,尽管理论上讨论很多,但是从目前的研究现状来看,其往往集中于疑罪从无的概念、理论依据、性质、效力以及具体表现形式,主要是以抽象法理或具
<正>SWOT分析法又称为态势分析法,它是由旧金山大学的管理学教授于20世纪80年代初提出来的,是一种能够较客观而准确地分析和研究一个单位现实情况的方法。
中国20世纪的文学变革是以语言文字的革新为起始和标志的,而白话文运动在这场历史文化变革中所具有的重要地位和意义,已经成为公认的和不争的事实。晚清白话文运动在戊戌变法
人类社会从未像今天这样重视娱乐,娱乐传播变得就像水、空气一样,成为现代人类的生存条件之一,占据着现代人类绝大多数的休闲时间。媒介市场的激烈竞争,传播伦理、传播法制的
本文深入剖析了在无障碍设计之后西方发达国家逐渐兴起的共用性设计理念,并根据该理念进行了家用沐浴产品系统的共用性设计实践。本文比较注重设计理论的研究。文章首先介绍了
本文在对以往动补结构语义指向的主要研究成果进行总结评价的基础上,提出对语义指向的研究不能停留在字面和形式逻辑的层面上,而应结合语言使用者的主观因素或主观经验,也即
<正>统一战线和民主政治是我党在抗日战争时期的重要政策。毛泽东同志说:"只要真能组织千百万群众进入民族统一战线,抗日战争的胜利是无疑义的。"①又说:"中国真正的坚实的抗
会议
把生物传感器技术应用于基因重组发酵过程的在线监控,运用顺序注射分析技术,完成样品的在线预处理,采用固定化酶-化学发光检测法测定发酵液中的关键底物甘油和甲醇的浓度。本
由宜兴市星光陶瓷研究所研发的XG-501铬缸走位剂,是一种单一添加的走位剂.它具有主盐的质量浓度低、光亮范围宽、电流效率高、操作温度低但范围宽、沉积速率快、覆盖能力优良
<正>2016年高考理科全国卷Ⅱ和卷Ⅲ的排列组合问题新颖有趣,表面上卷Ⅱ考查的是实际模型中的几何组合计数问题,卷Ⅲ考查的是纯数学的数列新定义计数问题,而如果站在更高的观