基于深度学习的电商评论文本细粒度情感分析

来源 :华侨大学 | 被引量 : 0次 | 上传用户:heishenggg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的不断革新和5G时代的到来,人们越来越倾向在网络上浏览商品和购买各种生活用品,同时发表自己对各种商品的看法和使用感受。这些评论中含有用户丰富的主观性看法,可以分析评论后提取到用户的情感倾向,从而对商品做出有效的改进。目前电商评论文本情感分析还存在词向量情感表达不准确,评价对象没有抽取导致的情感分析力度粗等问题,本文的主要工作如下:(1)针对Skip-Gram模型生成的词向量不能区分出情感倾向相反的单词和相同单词不同词性下具有一定差别的问题,提出一种融合Skip-Gram、词性和SO-PMI算法的情感词向量WSV-POSSO(Word Sentiment Vector based on part of speech and SO-PMI)生成方法。本文首先构建情感词表Senti Tabel表示单词不同词性下的词向量,然后通过利用TF-IDF对SO-PMI加权去得到单词中具有的情感信息,最后将Senti Tabel作为Skip-Gram模型的输入,通过在损失函数中加入情感信息来生成情感词向量。在训练过程中加入单词的词性信息后,生成的词向量可以对相同单词的不同词性进行区分;加入情感信息后,可以更清晰的区分开单词的同义词和反义词,同时也不影响单词的语义表达。在IMDB和NLPCC2014数据集上的实验结果表明,利用WSV-POSSO方法生成的情感词向量比Skip-Gram、GLOVE、SSPE方法情感分类准确率更高。(2)针对目前商品评价对象抽取的条件随机场方法需要大量的人工特征、没有结合输入和输出的相关性、不能融合全文范围的上下文的缺点,提出一种融合注意力机制和BI-LSTM-CRF的情感评价对象抽取方法。首先将评论文本序列化,然后利用双向长短记忆网络来处理序列标注,使用注意力机制对网络输出进行处理,找到评价对象更相关的词语;最后使用条件随机场算法来计算最优的序列标注路径,提高评价对象抽取的准确性。在Sem Eval-2014中的评价对象抽取数据集上的实验表明,该方法相比CRF,LSTM,BI-LSTM等方法抽取准确率更高。(3)针对单一的分类模型在评论文本情感分析中分类精度不高、泛化能力较弱的问题,提出一种基于LDA(Latent Dirichlet Allocation)数据集划分的stacking集成学习模型。该模型首先基于LDA的数据集划分方法来增强各个基分类器的差异性;其次,使用情感词向量对训练集进行词嵌入,训练不同的基分类器;最后,使用逻辑回归和多层感知机的方法来对分类器进行集成。通过情感词向量和LDA数据集划分的集成学习方法来对抽取出来的情感对象进行情感分析,实验结果表明,该方法有效地增强了不同分类器之间的差异,提升了分类的准确率从而完成细粒度的情感分析。
其他文献
直线电机伺服系统的抗干扰研究和高精准跟踪研究对于提高我国伺服系统的工业水平、实现精密化机床的生产研发具有重要意义。为了满足现代工业的高标准要求,直线电机伺服系统需要具备平稳运行和精准定位的综合输出能力。因此,本文以实现系统抗干扰性能和稳态误差性能的兼顾为目标,开展永磁直线同步电机伺服系统的高性能控制研究。首先,从电机运动方程出发,分析了系统抗扰动控制的必要性,设计了常规二阶线性自抗扰控制器。进一步
学位
分布式可再生能源发电给电力系统带来了清洁高效的电能,但同时也带来了一系列不稳定因素。分布式能源具有间歇性,会给频率调整带来较大困难。频率稳定是电能质量良好的重要体现,电力系统的正常安全运行离不开频率的平稳。用户侧的需求响应通过调整用户的用电量来参与频率调整,能够使电力系统更加灵活、快速的实现电能供需平衡。在分布式能源发电规模化并网、电力系统的频率稳定受到巨大挑战的背景下,基于需求响应的含分布式能源
学位
XY直线电机平台在轮廓运动控制等高精度定位的工业场景中应用广泛。由于直线电机对摩擦等非线性扰动敏感,系统的抗扰动性能仍有提升的空间,对XY直线电机平台的轮廓运动控制器研究具有极其重要的理论现实意义。本文以轮廓误差为直接控制目标,围绕基于双通道交叉耦合自抗扰的轮廓运动控制方法,研究具备扰动抑制能力和强协调能力的轮廓运动控制器。首先,基于交流电机统一理论,建立单轴直线电机系统的数学模型,并分析扰动作用
学位
我国的配网系统,消耗在变压器上的功率占线路总损耗的30%至60%,而变压器损耗中的50%至80%为其空载运行时的损耗,因此,增加节能型变压器的比重,可以有效地提高配网系统的运行效率。非晶合金变压器最大的优势就是其空载损耗低,主要原因有两个:1.非晶带材厚度约为硅钢片的十分之一,单片非晶合金厚度约为0.02mm~0.03mm,所以非晶铁芯的涡流损耗更小。2.与硅钢材料相比,非晶合金材料饱和磁密低,磁
学位
当今,随着中国人口老龄化程度加剧,人们对按摩的需求与日俱增,由于按摩领域的专业按摩师存在巨大缺口,因此,开发一款智能的按摩机器人来代替按摩师成为目前的当务之急。本文基于中医按摩理论设计了一款按摩机器人,并从运动学、动力学、轨迹规划、远程控制系统等方面开展理论与仿真实验研究,验证了方案的可行性。本文主要完成了如下工作:对常用的几种中医按摩手法进行生物力学特征分析,并将这些特征以量化参数的形式来表达,
学位
本文主要简述了BODIPY/aza-BODIPY荧光染料的设计合成方法以及在光动力疗法和光热疗法方面的应用,还合成了含-NMe2基团的非对称aza-BODIPYs染料和带有-CH2-X-(X=CH2,O,S)链的亚稠环扭曲的无卤素aza-BODIPYs染料及其性能研究。本文第二章通过4’-二甲氨基苯乙酮成功制备了一系列带有二甲氨基的非对称aza-BODIPYs。X射线晶体学分析证实了CF3-BDP
学位
随着法治政府的建设,公众参与的原则深入到环境保护、城乡规划等各个领域,相关的规范性文件层出不求,可以说是一个令人可喜的进步。但是,公众参与制度在实际运作过程中,效果并不理想,不仅公众参与的规范目标难以完成,参与对象的结构、代表性也有诸多不足之处,最后使得公众参与成为政府乃至其职能部门获致表面上的合法性的“走过场”制度,公众参与制度有被架空之虞。目前学界对公众参与制度的关注多侧重于“参与”,然而,事
学位
研究背景皮肤创面愈合涉及多种组织和细胞之间动态且协调有序的相互作用。在这些过程中,创面再上皮化和创面收缩是决定愈合效果的两个关键因素。表皮干细胞(Epidermal stem cells,EpSCs)是皮肤特异性干细胞,更新能力极强,是维持皮肤自我更新、参与损伤修复的关键细胞。在正常生理条件下,EpSCs锚定于干细胞巢等细胞微环境中,通过自我更新及分化来维持皮肤的新陈代谢。当创伤发生后,皮肤残存的
学位
双酰肼类化合物结构特殊,富含氮元素,因此具有一定的生物活性,并在许多领域应用广泛,可以作为昆虫生长剂、除草剂等农药产品的重要中间体,可以用来合成酶抑制剂,抗肿瘤、抗惊厥、消炎、抗疟等多种药物,也可以应用于电致发光系统、液晶和生物医学设备等工业产品上,更是杂环合成中的重要前体之一。其中N-异辛基-N′-氰乙酰肼是多种染料的关键中间体,优化其合成条件具有重要的工业价值。目前,不对称双酰肼的主要合成方法
学位
等离激元分子(PMs)类似于原子与分子系统,通过在人工设计组装的结构里不同的表面等离激元模式之间通过强耦合作用的情况下所形成具有共有化行为的纳米结构。在之前的研究中,传统贵金属材料(比如金与银)通过设计处理成各个形状的颗粒(如圆球、圆环、圆盘和三角形等)通过规则排列被广泛构成不同的等离激元分子结构。并且,在此结构下所计算的消光光谱中,两种相位相反的模式(即亮模式与暗模式)在共振频率范围内进行重叠,
学位