具有鲁棒性的多任务情感分析技术的研究与实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:eric_vl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的开放性使得用户可以在网上对参与过的活动发表评价,同时也为其他用户提供决策参考。爆炸式增长的信息量使得人工分析变得困难,对这些来自用户的评论进行自动化情感分析,具有较高的理论分析和实际应用价值。方面级情感分析是一种细粒度情感分析任务,基本的任务目的是寻找评价的对象以及对应的情感极性,也因此更具有挑战性。方面级情感分析有许多子任务,其中最基本的是方面词抽取以及方面情感分类。本文从三个方面讨论了如何构建鲁棒的方面级情感分析模型,分别为构建更强的模型、针对一般词替换攻击的防御措施以及任务相关鲁棒性问题的研究,具体内容如下:首先,本文提出了基于BERT的端到端旅游评论意见挖掘方法,将联合任务建模为统一的序列标记任务。利用BERT以及span抽取方法对方面级情感分析联合任务进行增强,并应用到了中文旅游评论中。针对中文评论存在的方面词缺失的问题,本文修改了联合任务的指向以得到较为完整的观点表达。相比于经典的序列标注方法,本文的方法取得了更好的效果。同时,本文构建了基于中文旅游网站评论的数据集,可用于中文方面级情感分析各个子任务的研究。其次,基于深度神经网络的脆弱性,本文提出了基于对抗训练和鲁棒性验证技术的防御方法,对一般的词替换攻击进行防御。具体的,通过对抗训练对模型进行增强,结合基于随机平滑的鲁棒性验证技术构造可证明的边界约束。通过在给定方面的情感分类模型上进行实验,证明了该方法在词替换攻击场景下的有效性。并且该方法可以忽略模型内部结构,成功应用在模型结构较为复杂的方面级情感分析任务中。最后,虽然单个子任务已经有了比较好的任务效果,但其鲁棒性问题依然值得探究。方面级情感分析具有特定的任务目的,一般的词替换攻击并不具有任务针对性。基于此,本文提出了针对方面级情感分析任务的鲁棒性问题,并提出了情感混淆攻击方法对相应问题进行探究。具体的攻击方式是对目标意见词进行同义词替换,以及非目标意见词进行情感翻转操作构建对抗样本。实验首先对生成对抗样本的质量进行了评估,并在不同的模型上进行攻击操作证明了方法的有效性,也体现了目前先进模型存在的鲁棒性问题。之后根据模型的表现,探讨了不同的结构以及融合的信息的影响。
其他文献
随着科技进步及日益增长的应用需求,近年来无人机呈现井喷式发展。由于传统单机作业的局限性,无人机集群受到了越来越多的关注,研究人员开始探索如何让无人机集群像自然界生物群体一样高效自主的完成特定任务。本文针对这一问题,以集群中无人机个体之间的位置差向量为基础,考虑内聚、排斥及速度对齐等规则约束,设计无人机的内聚速度、排斥速度、对齐速度等形成总的期望速度,并使无人机跟踪该期望速度达到无人机集群控制的目的
学位
通信技术已经发展到了第五代移动通信,但是作为通信系统的核心组件,功率放大器的非线性问题依然存在,数字预失真技术作为一种非线性校正的关键技术,由于其优异的性能、易于实现等特性,被广泛应用于功放的非线性校正。但是在新一代的通信技术中,传输信号的带宽更大、功率更强,给非线性校正提出了更高的挑战。为此,本论文引入了迭代学习控制技术,对该技术进行了分析,提出了一种基于迭代学习控制的数字预失真级联架构,实现了
学位
随着5G网络、物联网、人工智能等信息技术的快速部署,无人机因其灵活性、机动性、部署快等优点而作为信息网络最后一公里接入的新型手段之一,广泛应用于目标检测、跟踪、灾难监测等。无人机因其计算能力、通信能力、存储能力等限制而难以完成复杂的任务要求,无人机集群应运而生,其由多个无人机组成并以集群模式运行。然而,如何实现集群中无人机间高效通信是当前无人机集群面对的重要挑战,已成为当前无人机集群通信及应用的研
学位
计算机技术与通信技术的迅速发展,无人驾驶不再是单纯地猜想,越来越多的物联网智能化技术在汽车上得到利用。交通信号的检测与识别作为无人驾驶关键技术,对于车辆后续行为起关键作用。在无人驾驶中,需要快速准确获取前方交通信号并传递给决策层,决策层进行分析判断并传递给控制层,控制层对汽车行为进行控制。随着深度学习网络规模的增大,参数量变得很大,需要占用较大的内存空间和计算量,所以有必要研究能流畅运行的轻量化交
学位
近年来随着军民融合大趋势的深入发展,3mm频段除了在毫米波雷达、电子对抗、精确制导、保密通信等军事国防领域处于各国争抢的制高点,在如毫米安检成像、5G毫米波通信、跑道异物检测、汽车防撞系统等民用领域中也越来越备受关注。支撑各领域蓬勃发展的前提是3mm频段器件的研发与应用,然而3mm频段矢量网络分析仪对毫米波器件开发测量必不可少。因此研制矢网3mm频段扩频组件关键部件,实现老旧型号矢网以低成本实现扩
学位
单通道时频混叠信号分离是近几年来通信领域的重要研究,因其特殊的接收模式以及接收信号的时频域重叠的特性,故无法通过传统的滤波实现信号分离。该课题主要是研究单一传感器接收多个时频域重叠的信号组成的混合信号的分离问题。在此背景下,本文将针对该类问题的解决方案展开研究。主要贡献如下:1、针对基于多尺度分解的信号分离算法下小波基的选取问题进行了研究。首先,搭建了基于多尺度分解的信号分离算法的模型,通过对该算
学位
茶文化由国人的饮茶之习发展而来,禅文化则由印度禅佛教在中国的本土化发展而成,禅茶文化借助饮茶来拉近禅与人们的心理距离,提出参禅如饮茶,由此延伸出“禅茶一味”的思想和审美情趣。本文以“禅茶一味”的审美视角探究首饰的艺术表达,关注中国传统文化下的造物美学、禅茶联姻的文化现象及“禅茶一味”审美情趣的形成,回顾现代首饰的形态发展和设计规律,找寻禅茶文化与现代首饰设计间的关联。探索在多重问题暴露的社会环境中
学位
近年来深度神经网络模型已经成为人工智能领域的研究热点,包括了语音识别、图像理解、视频检测等方面的应用,但是随着神经网络的不断发展,后续的研究对神经网络在精度与速度方面的要求也越来越高,也使得网络模型的结构越来越复杂,参数越来越多,对应用场景与应用设备的要求也越来越高。于是,模型压缩概念方法被提出,模型压缩旨在保持网络的精度的同时,减少网络模型的参数量,从而减小模型的大小,提高网络的推理速度,使得网
学位
近几十年来,随着综合国力的不断提升,我国在航空领域取得了较为突出的成就,空中飞行器的种类和数量都在不断增长,但与此同时如无人机“黑飞”、滥飞”等事件也时有发生,给我们的生活带来各种安全隐患。从大量图像数据中对这些空中目标进行自动部位识别能够方便相关人员对空域进行的活动实行有效的监管,优化空域管理,减少人力成本,提高工作效率。本文基于语义分割对空中目标部位识别算法进行了研究,主要工作如下:(1)构建
学位
神经机器翻译是将一种语言的文本翻译成另一种语言的同义文本的任务,是自然语言处理的一个十分热门研究方向。如今,神经机器翻译在越来越国际化的社会起着至关重要的作用,其大都是基于序列到序列框架构建的,该框架包括一个编码器和一个解码器。编码器负责将输入的源序列映射到一个语义空间;解码器根据编码器的结果迭代地预测出目标序列。序列到序列模型的编码器的训练过程和测试过程是相同的,都是将源序列编码到一语义空间,但
学位