跨语言属性级情感分类研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:shulili1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性级情感分类任务旨在判断句子中针对某一个属性所对应的情感倾向,近年来,引起了自然语言处理领域学者的广泛关注。由于现有的相关研究大部分都是基于英文语料的,情感资源在不同语言上的分布并不均衡,跨语言的方法应运而生。跨语言属性级情感分类旨在使用源语言中的资源帮助目标语言进行属性级情感检测和分类,其核心问题在于如何实现跨语言知识的有效共享。本文针对这一问题对跨语言属性级情感分类展开研究,具体研究内容如下:(1)针对不同语言文本之间的语义关联问题,本文提出了一种基于注意力机制的跨语言属性级情感分类方法。首先,使用自注意力机制学习文本自身的特征;然后,引入跨语言注意力机制挖掘中英文文本对的关联特征;最后,利用特定于属性的注意力机制捕获关于属性的上下文特征,得到融合多情感、跨语言信息的句子表示。实验表明,基于注意力机制的方法有效构建了跨语言文本之间的关系,极大提高了跨语言属性级情感分类的准确率。(2)针对跨语言属性和句子的全局依赖结构问题,本文提出了一种基于图卷积网络的跨语言属性级情感分类方法。首先,利用整个语料库构建了一个跨语言的属性-句子异构图,将句子和属性视为图节点;然后,通过句子翻译关系、属性翻译关系和句子-属性共现关系来连接相关节点,捕获跨语言属性和句子的全局依赖结构信息;最后,将图结构和节点编码一起送入图卷积网络中。实验表明,基于图卷积网络的方法可以有效提取并整合双语语料库中的异构信息,帮助提升跨语言属性级情感分类的性能。(3)针对属性级情感分类标注样本有限的问题,本文提出了一种基于多任务学习的跨语言属性级情感分类方法。首先,抽取大规模的篇章级标注数据作为辅助训练集;然后,在该数据集上构造两个跨语言辅助任务:跨语言篇章级情感分类任务和中英文同义句判断任务;最后,联合学习主任务和辅助任务微调M-BERT模型。实验表明,基于多任务学习的方法可以有效传递篇章级文本和属性级文本共享的语义语法知识并捕获跨语言间的关联信息,从而提升跨语言属性级情感分类模型的性能。
其他文献
立场检测旨在给定的目标话题下,自动判断用户意见文本的立场态度(如支持、反对等),这对了解民众意愿、政府决策和智能推荐等具有重要意义。目前,深度神经网络模型由于其出色的性能得到广泛的应用,但文本外的大量信息仍未得到很好的挖掘与运用,特别是社交媒体中的用户信息交互等方面。本文的研究内容主要包括以下三个方面:(1)研究基于上下文关联关系的立场检测针对上下文信息交流单一而导致的交互信息易被忽视问题,本文基
学位
<正>数字金融是金融行业与互联网技术融合后产生的新金融服务形式,代表着金融行业未来发展的新方向、新趋势。在新技术赋能下,数字金融的服务功能比传统金融业更智能、更便捷、更高效,对区域经济发展也产生了更为深远的影响。本文聚焦数字金融这一新生事物,深入探究其对经济社会发展的影响机制,提出促进区域经济高质量发展的对策和建议。
期刊
问题生成(Question Generation,简称QG)是智能问答领域的重要任务之一,旨在根据给定文本,自动生成语法通顺、语义相关的自然问句。该技术能够赋予机器“自主提问”的能力,在新兴的智能教育、自动问诊和社区问答等场景中应用价值广泛。现有的问题生成研究往往采用教师强制学习方式,其驱动模型生成与标准问句相仿甚至一致的自然问句。然而,QG模型在测试阶段并无可参考的标准问句,仅能依靠非置信的信息
学位
随着城市地下空间不断发展,大断面矩形隧道因其较高的空间利用率逐渐得到广泛运用。通常情况下,暗挖矩形断面隧道多运用顶管法施工。施工中预制管节和地层相互作用主要体现为界面摩擦,且摩擦效应随着管节不断顶进而持续积累。因此,摩擦效应在顶进中不断累积会对周边地层造成持续性的扰动。由于矩形顶管的管土接触面积大,“背土效应”下摩擦作用对地层扰动影响显著高于常规圆形顶管。目前,针对矩形顶管施工地层变形分析中较少考
学位
现阶段,14天行程轨迹的查验已成常态化疫情防控的常用手段,基于轨迹大数据的实时处理有效作用于疫情防控中的时空伴随者监测、疑似病例的密切接触者排查等场景。同时,随着智慧城市建设进入新阶段,轨迹大数据计算与城市治理融合的模式及形态正在发生重大变化,表现在离线场景的轨迹分析已不能满足现状。日新月异的应用要求充分挖掘轨迹大数据的“新鲜”价值,亟需突破大规模轨迹数据的实时管理与精准查询手段,这对提升城市治理
学位
随着互联网信息资源的爆炸式增长,“信息过载”问题在搜索、电子商务、视频网站等众多网络应用中日益突出。作为解决“信息过载”问题的有效方法,推荐系统已经成为大数据时代的热门话题,在学术界和工业界得到了广泛的应用。目前,大多数的推荐系统都是基于用户的个人信息和历史行为数据进行推荐。然而,在许多场景下,推荐系统模型都是基于原始特征交互来获取信息,导致用户的个人信息和历史行为并没有得到充分的利用。仅仅在原始
学位
近年来,联邦学习作为一种新的人工智能边缘计算范式引起了广泛关注。联邦学习利用多个边缘设备作为参与者来协同训练深度学习中的全局模型,并且训练的过程不会泄露任何参与方的本地数据。在典型的边缘计算场景中,联邦学习的参与者通常为异构分布,由个人电脑、智能手机、物联网设备、网络设备等各式设备组成。在设备异构的背景下,算力较弱的设备被称为掉队者,会成为联邦学习中每一个训练轮次中的瓶颈,进而限制模型总体收敛速度
学位
基于全监督学习的目标检测在现实场景下严重依赖完整标注的数据,使得在一些现实检测场景中难以应用传统的全监督学习方法,本课题采用弱监督学习方法开展目标检测方法研究。在弱监督目标检测中由于缺乏位置标注信息,模型易使目标尤其是非刚性目标的检测结果收敛到目标最具判别性局部区域,从而导致目标的检测结果不完整。此外在进行伪标记过程中过分关注分类置信度最高的局部目标区域,使得其他正实例样本挖掘不充分。因此本文针对
学位
软件测试是软件工程不可或缺的重要环节之一,而众包测试是软件测试的一个重要分支。在众包测试中,工人执行测试任务并提交测试报告,开发者需要对提交的测试报告进行审查和评估。由于测试报告数量众多且往往质量参差不齐,开发者在人工审查过程中将花费大量时间,直接影响了众包测试效率。近年来,出现了许多自动化技术,如聚类、分类和排序技术,以减少审查数量并提高审查效率。然而面对移动应用众测报告的文本和图像信息时,已有
学位
目前动漫图片风格的电子游戏拥有越来越大的市场和受众。在该类游戏开发中,存在高质量的背景绘制需要耗费资源巨大的问题,该类游戏在制作过程中通常需要绘制不同时间条件下的差分图,并要求电子游戏的背景图片比一般动漫图片纹理及色彩更丰富,边缘更清晰,而现有的动漫风格图像迁移方法仅支持照片域图像向动漫图像单一时间节点域的映射,并不能很好胜任这项任务。本文在基于生成对抗网络的从照片生成动漫风格电子游戏背景图片算法
学位