结合对抗学习框架和情感知识库的讽刺识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ccmsdn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的飞速发展,在网络上表达情绪的人日益增多。现有的文本情感分析系统虽然能够正确分类大部分文本的情感极性。但是当文本中存在讽刺时,现有系统往往会产生错误分类结果。讽刺是一种复杂的语言形式,它将字面上明显正面或负面的话语转化为相反的情感倾向。现有的讽刺识别方法主要分为基于规则的方法、基于机器学习的方法以及基于深度学习的方法。其中,基于规则和机器学习的讽刺识别方法均依赖专家规则和人工筛选特征。基于深度学习的识别方法虽然能够有效提高系统的泛化能力,但往往依赖大规模有标注数据。针对现有方法的不足,本文研究基于对抗学习的讽刺识别方法和结合情感知识库的讽刺识别方法。针对缺乏高质量讽刺标注数据的问题,本文研究基于对抗学习的神经网络讽刺识别模型。在注意力神经网络讽刺识别模型基础上,研究基于对抗样本的对抗学习框架,在模型训练过程中定向生成对抗攻击样本参与模型训练,增强模型的鲁棒性和泛化性能。进而,研究基于领域迁移的对抗学习框架,引入跨领域讽刺识别数据,改进模型在目标领域的讽刺识别性能。同时,本文还研究上述两种对抗学习框架的结合,进一步提高模型的泛化性能。实验结果表明,基于对抗学习的模型在三个公开的IAC讽刺识别数据集(Generic、Hyperbole、Rhetorical Questions)上相比基模型的F值提升均超过3%。考虑到对抗学习框架只是从数据层面上提高模型的性能,但忽略了讽刺本身的一些表达特性。本文引入外部情感知识库,从讽刺的两个直观特性(语义一致性和情感一致性)出发,在模型中引入文本相似矩阵和情感交互通道,研究结合情感知识库的讽刺识别模型。实验结果表明,结合语义一致性和情感一致性的讽刺识别模型相比注意力卷积网络模型在Hyperbole数据集上的F值提升超过7%。同时在Generic和Rhetorical Questions数据集的F值提升分别超过2%和3%。在此基础上,本文还研究将结合情感知识库的讽刺识别模型与对抗学习框架结合。实验结果显示,相比基模型,该方法在Hyperbole和Rhetorical Questions数据集上分别有超过4%和5%的F值提升。
其他文献
逆电渗析(RED)是基于膜的将溶液的盐差能转换成电能的技术。在RED电堆中,一般采用不传导离子的聚合物隔网对相邻的离子交换膜进行分隔,由此形成供溶液流动的通道。隔网的存在虽然可以增强溶液的掺混从而减小浓差极化,但也会带来一些问题:不传导离子的隔网直接覆盖在膜的表面,减少膜的有效面积;同时,使通道内离子的移动路径变得曲折,导致电堆的欧姆内阻增加。如果使用异形膜来替代传统的光滑膜与隔网的组合,则有可能
色光在科研、生产、生活中被广泛应用,如彩色电视成像系统空间分辨力检测、商场灯光渲染、投影等场合。随着对色彩应用要求的提高,对色光的色彩进行高精度控制是非常必要的。本文设计了复色光的色彩控制系统,开展了色彩控制技术相关的理论计算、方案设计、实验系统搭建和控制方法研究等四个方面的研究,具体内容如下:一、通过对色度学基本原理的研究,分析了颜色空间和颜色空间转换的特点,确定线性空间CIE1931 XYZ作
乌克兰是一个农业大国。国内粮食生产高度结合可持续的外部需求使乌克兰成为世界主要粮食供应国的一组国家。与此同时,国内粮食市场的出口因素很难夸大它,因为外部供应是利用
太赫兹波由于其在生物医学、安全检查、通信技术等方面潜在的应用价值,成为目前热门的研究领域之一,而太赫兹源技术是其中一个重要也是最基本的研究方向。非线性光学差频技术由于高效、高功率、精简的结构以及可调谐等优点,成为了研发太赫兹辐射源的一种重要技术,而如何实现差频过程中的相位匹配是一个关键问题。腔相位匹配(CPM)技术在近年来得以实验验证,并展现出在制备小型太赫兹源方面的潜在优势。而目前的研究报导中鲜
由于稀土化合物具有优异的光谱性质,而具有3d10电子组态的过渡金属Cd2+离子能够与有机配体之间通过能量传递而具有较好的发光性能,因此本课题选用含氮杂环羧酸类配体和镧系及
金属有机多面体结构的设计合成及其在传感、识别、催化、活性物种稳定化等方面的应用受到了科学家们的广泛关注。传统金属有机多面体由具有固定配位构型的过渡金属构成,其中
本文分别提出了圆形区域和球形区域上特征值问题有效的谱Galerkin逼近。对于圆形区域,我们提出了steklov特征值问题的谱Galerkin逼近和严格的误差分析。首先,我们利用极坐标变换和变量分离技巧把原问题化为一系列等价的一维特征值问题,而且这些一维的特征值问题是相互独立的,从而可以并行地求解。然后,我们推导了极条件并根据极条件引入了相应的带权Sobolev空间。结合正交多项式的逼近性质,我们
张量理论在数据挖掘与处理、神经网络、图像处理、化学计量和心理测量、物理学中的弹性分析等领域中有着不可或缺的作用.特别地,强?-张量的判定问题作为张量理论的一个组成部分在判定多元偶次齐次多项式正定性问题中起着至关重要的作用.然而,强?-张量的判定问题存在着诸多困难.因此,判定一个张量是否为强?-张量具有重要的理论意义和实际应用背景.本文主要研究强?-张量的判定问题.首先,给出一种新的强?-张量迭代判
近年来,企业对智能客服的需求越来越旺盛。传统交互中客户需要和多个部门打交道,低效、成本高,未来交互可以通过智能客服系统来快速准确地过滤用户的大部分需求,从而减少对人
有机-金属碘化物杂化型聚合物因在光电转换、刺激响应、铁电、非线性光学材料等领域具有广阔的应用前景,成为材料科学领域研究的热点之一。特别值得关注的是可用于光信号处理