面向产品评论的跨领域情感分类方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:jason23431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,社交网络、电子商务逐渐成为生活中重要的一部分。对产品评论、商品评价等文本数据进行情感极性分析,有助于了解用户情感倾向,具有重要的意义。因而,针对产品评论的极性分析逐步成为新的研究热点。目前产品评论中的语料所涉及的领域和范围十分广泛,领域的标签数据获取较为困难,为新领域手工标记足够的样本数据是费时且费力的;用户评价所用的评语存在着不同,易造成领域间特征的分布差异,导致标记数据领域中训练好的情感分类模型在新的领域中性能较差,难以获得理想的分类效果。为了提高面向产品评论的跨领域情感分类方法的准确率,本文主要为不同领域的样本数据构建相同的特征空间,来解决不同领域间特征分布不同的问题,减少领域间的域间差异,完成跨领域情感分类任务。本文主要开展了以下两个方面的研究工作:1、提出了一种改进枢轴特征选择的跨领域情感分类模型。该模型充分利用词形还原和卡方检验特征提取算法选取领域间有着相同表征的枢轴特征,并将选取出的枢轴特征作为沟通不同领域间的桥梁,通过神经网络将领域间的非枢轴特征和枢轴关联起来,将领域间的特征映射到低维度、共享的特征空间中去,减少领域间的域间差。在亚马逊公开数据集的实验中,与基线模型相比,本文所提出的模型是有效的。2、在改进枢轴特征选择的跨领域情感分类模型基础上,提出了一种基于融合词性向量和注意力机制的跨领域情感分类模型。在基于改进枢轴特征选择算法取出枢轴特征后,特征表示阶段中,融合包含语义的词向量以及包含词性的词性向量,作为特征的向量表现。在特征映射阶段,通过长短期记忆神经网络中已有的序列来预测当前特征是否为枢轴特征,更好的得到非枢轴特征和枢轴特征之间的映射关系,实现将领域间的特征映射到低维度、共享的特征空间中的目的。并且在情感分类器构建阶段,基于映射特征,结合多头注意力机制训练情感分类器,实现更好的分类性能,达到更高的分类准确率。在亚马逊公开数据集上的实验表明,本文所提出的基于融合特征和注意力机制模型有效的提高了在目标域情感分类准确率。
其他文献
随着管网总里程的不断增加,天然气管网的拓扑结构会变得越来越复杂,进而逐渐呈现出系统复杂化的趋势。复杂的管网拓扑结构容易使管网存在固有结构缺陷,对管网的安全运行有所
目前,我国已进入管道事故高发期。面对多样的事故,如何预防以及处理这些事故是亟需解决的问题。本文针对三个实际案例进行了研究,为预防及处理类似问题提供一定的参考。在管
血栓弹力图(Thrombelastograph简称TEG)是根据凝血纤溶过程中血块的粘弹性变化所绘制出的一条上下基本对称的曲线。传统的凝血功能检测很难区分各种凝血细分类型,对于疾病的
公司的股利政策是多方经济利益权衡的结果,股利政策不仅影响公司的股价,还会影响一些利益相关者如投资者和债权人对公司的态度,进而影响公司的投资机会、融资能力以及发展前景。因此股利政策对于公司的发展至关重要。近年来,在我国强制分红政策的影响下,越来越多的上市公司开始关注股利的发放,我国上市公司“铁公鸡”现象逐渐减少。但由于我国资本市场起步晚,各方面政策不完善,上市公司超额派现问题开始凸显,逐渐引发社会各
W/O型乳状液是一种两相分散体系,其蜡沉积过程比单相原油更加复杂,分散相水滴的存在会影响蜡分子的扩散和蜡晶的沉积过程。所以,深入研究W/O型乳状液蜡沉积规律具有重要意义
含水原油在经历开采、集输过程时容易形成乳状液,乳状液的形成对油水两相流动特性会产生显著影响。流动条件下持续的剪切作用能够使乳状液液滴的破裂和聚并保持动态平衡,使乳
耕地作为可变性最强的土地类型之一,与人类的生存和发展息息相关。而在当前中国城乡发展转型的重要时期,耕地已经并正在经历着广泛而深刻的转型。在此背景下适时开展耕地利用
齿轮作为传动机构齿轮箱必不可少的关键部件,运行工况复杂,其状态监测与故障诊断直接影响复杂传动装置的安全正常运行,对企业乃至社会均具有巨大的经济价值和安全价值。传统
目前,随着环境和能源问题的日益恶化,节能环保逐渐成为汽车制造的重要内容。用铝合金板替代传统的车身钢板,不仅可减轻车身重量、有利于节能环保,一定程度上还能提升了汽车安
基于简化ARINIC424编码技术对预警机典型任务实现了水平引导,采用飞行器推力不对称的方式实现了预警机平飞转弯功能,运用了遗传算法对控制律参数进行了优化。仿真结果与协调