跨领域情感回归方法研究

来源 :苏州大学 | 被引量 : 2次 | 上传用户:yokuchan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和电子商务的迅速发展,情感分析受到自然语言处理领域研究者越来越多的关注。情感分析有很多的社会应用,如信息抽取、在线广告和推荐系统等。本文讨论的情感回归是情感分析的一项基本研究任务,该任务旨在对文本表达的情感进行自动评分。以往情感回归的研究通常都需要大量标注样本来训练机器学习模型。然而由于领域分布的多样性,在一个领域训练得到的回归模型通常在别的领域性能不佳,而对每个感兴趣的领域都标注样本又非常耗时耗力。为了解决上述问题,本文从目标领域标注样本数量多少的角度出发,对跨领域情感回归方法进行研究,具体研究内容分为以下三个方面:首先,针对目标领域有充足标注样本的情况,本文提出了融合分类和回归模型的评论评分方法。基本上,分类模型和回归模型是评论评分的两类主要方法,两者都有各自的特点和优势。我们的方法可以充分结合分类模型和回归模型的优势。具体而言,我们采用了一个基于辅助分类模型的长短时记忆网络(Long Short-Term Memory network,LSTM)层从分类模型中学习辅助表示,并且同时将辅助表示加入主LSTM层学习评论回归模型。在训练过程中,联合学习辅助LSTM分类模型和主LSTM回归模型。实验结果表明,我们的联合学习方法比单独使用分类或回归模型性能都要好。其次,针对目标领域有少量标注样本的情况,本文提出了一个新的情感回归的监督领域适应方法。当目标领域样本较少,不足以训练得到一个好的回归模型的时候,可以用监督领域适应方法来提高目标领域的性能。并且,由于源领域和目标领域的评分范围可能不一致,情感回归的监督领域适应更具有挑战性。为了解决上述问题,我们提出了一种跨领域LSTM模型。具体而言,该模型使用辅助LSTM层从源领域学习辅助表示,同时将辅助表示加入到主LSTM层用于目标领域回归任务的训练。在训练过程中,源领域的回归模型和目标领域的回归模型联合训练并更新参数。实验结果表明,我们的联合学习方法比几个强大的基线方法性能要好。最后,针对目标领域只有未标注样本、没有标注样本的情况,本文提出了一个新的情感回归的半监督领域适应方法。当目标领域只有未标注样本时,采用半监督领域适应方法来提高目标领域性能,与监督领域适应方法相比难度更大。针对该任务,本文提出了基于变分自编码器的情感回归半监督领域适应方法。具体而言,首先使用长短时记忆网络(LSTM)来实现回归模型,其次我们用变分自编码器(VAE)来实现生成模型,最后联合学习LSTM回归模型和VAE生成模型,实现基于变分自编码器的情感回归半监督领域适应方法。实验结果表明,我们的方法比几个强大的基线方法性能都要好。
其他文献
目前许多图像分割方法通常依赖于图像的颜色、梯度等底层信息对图像进行分割,当图像中的目标与背景有较大差异或者二者具有易于区分的特征时,往往能得到正确的分割结果。但是
我们的社会在逐步发展,高新技术产业也越来越进步,为了提高通信的速度与准确度,很多学者们都想到了把无线接入网络与光通信结合在一起。为实现这个想法,学者们开辟了一个新兴
十字花科芸薹属植物芥菜(Brassia junceaL.)是中国的特产蔬菜,其营养物质含量丰富,籽粒经发芽后芽苗中内源酶系统被激活,尤其是具有多种生理作用的褪黑素等功能性物质得以富集。高等植物中褪黑素主要由色氨酸经过四步酶促反应生成,其中色氨酸脱羧酶(TDC)、色胺5-羟化酶(T5H)、血清素N-乙酰转移酶(SNAT)、N-乙酰基-5-羟色胺-甲基转移酶(ASMT)是合成褪黑素的关键酶。植物在逆境
本文通过对"以人为本"设计思想的剖析和反思,分析了该设计思想的积极意义及其局限性,从而给予工业设计中"以人为本"设计思想以更合理的定位,提出在工业设计中"以人为本"必须
结题报告编号:JKY10105时间:2018年5月——2020年5月1.选题的意义、价值和理论支持1.1选题的理论意义《中学语文新课程标准》提出:"要对学生进行听、说、读、写的基本训练,培
会议
物联网技术随着网络的不断普及正在兴起,而无线传感器网络(WSN)作为物联网的一种实现形式,其重要性也在国防、环境、交通等诸多方面不断被强调。而当今社会又面临能源和环保
MR图像中含有丰富的人体组织信息,利用这些信息对MR图像中的各组织进行有效分割可以帮助医生及病患了解病变区域以及各器官的尺寸、位置以及形状等准确信息。然而,临床采集的
E-CARGO模型是近几年来出现的极为灵活的基于角色的合作学系统模型,使用E-CARGO模型能够解决很多传统合作学中无法解决的问题,在分配问题以及再分配问题上,E-CARGO模型也有极
随着无线通讯技术的不断发展,基于定位的各种应用服务层出不穷,无线传感器网络(Wireless Sensor Networks,WSNs)以其自身低功耗、低成本的优点,在智能家居、环境监控、军事侦
随着硅微机械陀螺仪技术的迅猛发展,常压封装陀螺仪应运而生。它凭借封装工艺简单、成本低、体积小、易于集成等优点,得到了部分民用领域、研究机构及工商界的高度重视,具有