情感分析无监督领域适应问题研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:licx1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性级情感分析(Aspect Based Sentiment Analysis,ABSA)是情感分析领域的重要任务之一,受到了学术界和工业界的广泛关注。ABSA的目标是抽取评价属性并识别针对属性的情感倾向,在商业智能、舆情分析等场景中,能够提供更有价值的信息。与粗粒度情感分析相比,ABSA任务所需的标注成本也更加昂贵,需要同时标注出文本中所有的属性词以及对应的情感。有监督的模型需要大量有标签样本进行参数优化,高昂的标注成本限制了实际应用。在无监督领域适应场景中,目标领域没有任何有标注数据,只依赖无标签数据和源领域的训练数据,进行模型训练。面向ABSA任务的无监督领域适应方法允许使用其他领域的有标签数据进行模型训练,然后在目标领域进行属性级情感分析任务,可以有效地缓解有标签数据依赖问题。本文开展面向属性级情感分析任务的无监督领域适应研究。具体包含以下两个方面的工作:1.联合特征和样例的属性级情感分析领域适应。在先前的工作中,针对ABSA的跨领域方法都是基于传统的神经网络模型(如LSTM等),并且都是从学习共享特征的角度减少领域差异。本工作基于BERT,从特征和样例两个层面进行跨领域属性级情感分析任务。在四个标准数据集上的实验结果表明,以Micro-F1为评价指标,取得6.92个百分点的提升。2.基于风格转换的属性级情感分析领域适应。领域适应问题的本质是数据来源不同造成的训练数据和测试数据分布不一致。本工作通过实验观察发现,在ABSA任务中,这种数据分布差异主要体现在词汇差异上,即属性词和观点词分布不一致。本文提出使用领域风格转换的思想减少领域差异。实验结果表明,利用领域风格转换生成的伪样本能够有效提升目标领域的ABSA任务。并且,结合原始样本和伪样本的多源融合的训练方式进一步提升了跨领域属性级情感分析的效果。
其他文献
为了进一步提升对置活塞式自由活塞发动机(Free-piston Engine,FPE)的燃料利用效率与排放性能,本文以课题组研制的第四代对置活塞式FPE作为研究对象,采用三维计算流体力学的方法对发动机的缸内燃烧过程进行了参数化仿真研究。研究内容主要包括以下几个方面:(1)基于对置活塞式FPE的具体结构,设计了喷雾导向型燃烧组织方式。分析了发动机混合气形成过程和燃烧过程的评价指标。(2)建立了对置活
被动导引头是反辐射导弹(Anti Radar Missile,ARM)的重要组成部分,其需要在复杂的电磁环境中对雷达信号进行实时准确地搜索和跟踪,并能在诱骗条件下引导ARM最终成功打击目标。被动导引头接收到多部雷达交织在一起的脉冲序列,通过雷达信号分选技术将交叠的雷达信号分选出来,当成功锁定目标后,进行诱饵识别,从而准确打击目标。本文针对ARM导引头上的关键技术雷达信号分选和抗诱骗技术进行了研究,
C-N轴手性化合物是多种高效配体和催化剂的核心骨架,广泛存在于天然药物和生物活性分子。烯酰胺类轴手性化合物是C-N轴手性化合物的表现形式之一,备受研究人员的广泛关注。本论文的研究内容主要是通过不对称烯丙基化-异构化反应体系合成烯酰胺类轴手性化合物。目前,烯酰胺类轴手性化合物的获得主要依赖于手性制备液相,其高效的立体选择性合成方法尚无报道。本论文通过不对称烯丙基化-异构化串联反应首次合成了烯酰胺类轴
针对钝感剂在发射药贮存期间的扩散迁移影响发射药服役寿命的问题,采用分子动力学模拟(Molecular Dynamics Simulation,MD Simulation)比较邻苯二甲酸二丁酯(DBP)、丁基硝氧已基硝铵(Bu-NENA)、硝化三乙二醇(TEGDN)与聚新戊二醇己二酸酯(NA)四种典型钝感剂在发射药体系中的扩散性能。同时,探究温度、硝化棉(NC)含氮量、钝感剂浓度和硝化甘油(NG)含
学位
学位
双频探测一般采用多种吸光材料复合的方式,以特殊的复合结构实现单一材料不能实现的波段选择探测,比如拓宽探测波长,划分探测范围,以实现特殊的波段探测需求。目前主要有紫外-可见双频探测、可见近红外双频探测、紫外-红外双频探测、以及近红外中红外双频探测等等。有机无机杂化钙钛矿由于其高的光吸收效率,高的载流子传输效率以及长的载流子扩散长度的独特优势,在LED、太阳能电池、探测器和激光器中有着广泛应用。光学带
知识图谱作为目前高效的信息管理技术,能够提高搜索引擎和问答系统的性能,具有广泛的研究前景。知识图谱的构建是应用的基础,关系抽取作为信息抽取的主要任务之一,能够为知识图谱构建提供实体关系三元组,是知识图谱构建的关键技术。远程监督关系抽取方法通过数据自动对齐远程知识库来解决有监督需要大量标注数据的问题,适合应用到知识图谱构建领域,但是远程监督获取的标注语料中存在大量的噪声数据,会影响模型的性能。知识图
学位
物联网的发展要求器件设备轻便、无线、可穿戴,但是由于缺乏电缆供电以及电池空间和使用时间上的限制,使得方便持续地为这些设备供电成为一个挑战。可穿戴热电器件有望通过材料的热电效应将环境热能转化为电能来解决这一挑战。热电技术作为一种能够直接将热能和电能互相转化的能源转换技术,具有绿色无污染、安全可靠、可重复利用、无位置限制等诸多优点。然而,传统热电材料大多存在机械稳定性差或室温热电转换效率低等问题。针对