基于深度神经网络的跨领域文本情感分类

来源 :福州大学 | 被引量 : 0次 | 上传用户:zjx1978_0901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨领域文本情感分类旨在利用迁移学习算法实现领域间的知识迁移以解决目标领域标注样本匮乏的问题,是自然语言处理领域中重要研究分支之一。目前研究者们提出了一系列基于深度学习的方法来学习领域间的共性特征并取得了一定的成果。尽管如此,仍然存在以下挑战:现有方法捕捉句子中局部关系的能力不足,导致情感分类存在偏差;以往方法在提取文本特征时难以有效利用文本的上下文依赖关系与整体信息;现有模型存在分类特征空间受限的问题,难以适应于跨领域文本的情感倾向预测,本文针对上述问题展开以下三个方面的研究:第一,针对现有跨领域文本情感分类方法难以准确刻画文本局部语义关系的问题,提出了一种基于多窗口卷积神经网络的跨领域文本情感分类方法。该方法构造三个卷积核大小不同的卷积层,提取不同特征空间上的语义信息;接着使用最大池化操作和拼接得到融合后的全局特征表示;最后通过分类器进行情感类别对抗学习,学习领域适应的文本特征表示用于跨领域情感倾向性分析。实验结果表明,该方法相较于基准模型在Amazon数据集上的平均准确率提升了1.0%。第二,针对现有跨领域文本情感分析方法难以捕获全局信息且忽视了长文本上下文依赖信息的问题,提出了一种基于双向循环神经网络的跨领域文本情感分类方法。该方法首先采用双向长短期记忆循环神经网络(Bi LSTM)提取包含整体信息的特征向量;其次通过残差连接的方式将整体信息与局部信息融合;最后优化文本特征表示以减少源领域与目标领域之间的差异,并进行文本情感分类。实验结果表明,与基准方法相比,该方法在Amazon数据集的四个领域平均准确率上进一步提高了1.1%。第三,针对现有方法在分类网络的设计上未充分考虑不同判别特征的差异,导致情感极性推断信息不足的问题,提出了一种基于集成学习的跨领域文本情感分类方法。该方法在基于Bi LSTM的工作上,引入双层堆叠情感分类模型。首先文本经过特征提取网络生成文本特征表示;接着输入到第一层分类模型训练得到新的训练和测试样本;再输入到第二层分类模型进行训练,得到最终情感极性标签。实验结果表明,相较于基准模型,该方法在Amazon数据集上的平均准确率提高了0.8%。
其他文献
现实世界中的复杂系统可以抽象为复杂网络,如蛋白质交互网络、科学家合作网络、文献引用网络等。复杂网络中的一大重要特征是社区结构,其含义为复杂网络中具有紧密内部连接的子图。在复杂网络中发现社区结构有助于揭示复杂网络的内在特性、了解复杂网络内部节点关系及演变趋势,为现实世界中的许多实际应用提供强有力支撑,因此社区发现逐渐成为复杂网络中的研究热点。然而,随着大数据技术的高速发展,复杂网络的规模呈指数倍数增
学位
随着地球村概念的提出以及经济的发展,金融市场变得更加开放,我国经济正在逐步进入信用经济时代,在这个时代,信用消费已成为人们常用的一种消费方式。随着各类信用用户的增多,信用缺失、信用欺骗等问题逐渐显现,这说明我国信用体制还有待完善。为了避免上述问题的发生,分析用户的信用成为关键环节。本文主要研究用户信用体系中的用户画像和信用评级,主要工作可分为以下几个部分:第一,介绍了金融数据的不平衡性并研究了不同
学位
图像修复的目标是利用图像中已知内容,按照一定的修复规则,自动地恢复丢失的内容,具有极其广泛的应用价值。而近年来深度学习在图像修复领域取得了一定的突破,但仍然存在一些问题,比如修复区域较大时,边缘容易产生伪影干扰等。且基于深度学习的模型大多数是基于自然图像进行设计训练,因此在自然图像上表现优秀的模型移植到特定样本经常难以达到预期效果,如医学图像。基于以上问题,本文主要的研究内容和工作创新点如下:(1
学位
近年来,人们在机器阅读理解的研究上取得了很大的进展。机器阅读理解的主要任务就是通过给定的文章和相对应的问题,利用模型的理解和推理能力给出问题的对应答案,因此如何提升机器阅读理解模型的推理能力,成为了机器阅读理解的重要研究方向之一。在机器阅读理解领域,大部分模型是针对特定阅读理解任务与数据集。本文分别针对离散推理和文本跨度预测类阅读理解问题提出相应的深度学习模型,并分别基于DROP(Discrete
学位
空气污染对人类健康造成严重危害,已成为一个难以解决或不可逆转的全球性环境问题。虽然建立了空气质量监测站来收集空气中的污染物成分数据,但由于监测站的建设费用非常昂贵,为了节省成本,监测站只部署在少数地点,并且需要进行维护,仅在部分时间启动。因此,我们只能得到部分位置和时刻的空气质量数据。由于空气质量数据量多且特征复杂,现有的工作根据已有部分位置和时刻的空气质量数据,使用深度学习技术推测其它位置和时刻
学位
随着信息通信产业的发展,在我们经历了互联的网时代、移动互联网的时代之后,如今已经走向物联的网时代,这个时代赋予了应用创新和发展的更大的机的会。在诸多场景应用中,对的于物的联网技术运用的得最丰富和的典型的就是的智能家居。智能家居是的以家庭的住宅为的平台,使用的物联网技的术集成与的家居生的活有关的基础的设施,提供了智能化的智能家居服务,从而为人们提供便利和舒适居住环境。同时随着各类智能虚拟助手的兴起,
学位
视觉目标跟踪是计算机视觉的一个重要研究领域。对于一个图像或视频序列,在仅有第一帧标注的情况下,视觉跟踪方法需要在后续的帧中预测目标位置。视觉目标跟踪可以对图像与视频中的任意目标进行跟踪,因而常常作为大型视觉系统的重要组成部分,具有较高的理论和应用价值。基于深度学习的目标跟踪方法在多个测试基准取得了较好的表现,但是仍然存在模型构建成本高、泛化能力受限、物体表征精确度低等问题。为应对上述挑战,本文从语
学位
随着智能手机等设备的普及,各种数字图片更加频繁地出现在人们的日常生活当中。如何让计算机通过图像来认识世界是许多学者一直研究的任务,其中一个重要子任务是图像显著性检测。图像显著性检测是许多图像处理任务的重要步骤之一,目前已经提出很多图像显著性检测方法。RGBD图像相较于彩色图像拥有额外的深度图,具有更全面的3D空间结构信息。本文致力于研究基于深度学习的RGBD图像显著性检测方法,包括基于边缘感知和跨
学位
文本情绪原因识别任务的目标是从文本中识别某种情绪表达背后的原因,已逐渐成为自然语言处理领域中的热点研究方向之一。近年来,随着深度学习技术的发展,该领域的相关研究取得了不错的进展。尽管如此,仍然存在着诸多挑战:未能充分利用文本子句间的相对位置距离特征,难以精确定位目标情绪子句的位置所在;未能充分挖掘文本中字符级、词语级等多粒度的文本语义特征;不能很好解决情绪多样化和数据不平衡带来的模型性能受限的问题
学位
公共交通在很大程度上能提高道路利用率,降低程度拥堵。城市轨道交通在公共交通中占据了相当重要的一环,相对于普通公交而言,轨道交通拥有独立路权,不会受到高峰时期道路拥堵的影响,同时城市轨道交通的运力又远大于同样拥有独立路权的快速公交。城市轨道交通成为了越来越多大城市缓解道路拥堵问题,改善路面交通的首要手段,是城市交通的核心之一。地铁客流关系到地铁系统的运营调度,是地铁数据中重要一环。分析不同条件下地铁
学位