【摘 要】
:
随着在线社交网络的蓬勃发展,越来越多的人喜欢在互联网上以文字的形式表达自己的情感,例如用户可以对已购买的产品进行评价、对外卖订单给出点评、在微博等网站上发表自己对某件事情的看法等等。而对这些包含大量情感、态度、观点的文本进行情感倾向分析已经成为自然语言处理领域的一个非常热门的研究方向,具有实际的商业价值以及学术研究意义。以往的情感分析研究多为篇章级或句子级,即把整段文本归纳为一种情绪,这种研究已经
论文部分内容阅读
随着在线社交网络的蓬勃发展,越来越多的人喜欢在互联网上以文字的形式表达自己的情感,例如用户可以对已购买的产品进行评价、对外卖订单给出点评、在微博等网站上发表自己对某件事情的看法等等。而对这些包含大量情感、态度、观点的文本进行情感倾向分析已经成为自然语言处理领域的一个非常热门的研究方向,具有实际的商业价值以及学术研究意义。以往的情感分析研究多为篇章级或句子级,即把整段文本归纳为一种情绪,这种研究已经无法满足“互联网+”经济的需求。为了更好的贴近实际应用,方面级情感分析(Aspect-based Sentiment Analysis,ABSA)应运而生。ABSA是更细粒的一种情感分类,旨在识别给定对象的情感极性,例如评论文本“这家餐厅的味道不错但是价格略贵”中的方面词“味道”和“价格”的情感极性分别为“积极”和“消极”。ABSA任务包含4个子任务:方面词提取(Aspect term extraction,AE)、方面词情感分类(Aspect-term sentiment classification,ASC)、方面类别分类(Aspect category classification,ACC)、方面类别情感分类(Aspect category sentiment classification,ACSC),本文的研究围绕方面词情感分类任务(ASC)展开。ASC的传统解决方法多为基于情感词典和使用机器学习的方法,然而这些方法都依赖繁重的特征工程,且有性能瓶颈。而深度学习可以通过构建神经网络自动进行学习提取特征,已经成为情感分析领域的主流方法。因此,本文也基于深度学习提出不同模型来解决ASC问题。为了阐述方便,本文将ASC任务统称为方面级情感分类任务。总结来说,本文主要工作如下:(1)针对传统的方面级情感分类任务,提出一种基于混合神经网络的方面级情感分析模型HCL-MHA(Hybrid CNN and LSTM based on Multi-Head Attention)。该模型通过混合LSTM-MHA(LSTM based Multi-Head Attention)特征提取模块和CNN特征提取模块来捕获文本特征。LSTM-MHA中的双向LSTM可以有效从方面目标的前向和后向学习到上下文语义,且多头注意力机制能够捕获长距离依赖;而CNN用来提取局部特征,两者互为补充,使模型能够同时提取到文本的全局语义和局部情感语义。该模型Restaurant数据集的三分类任务上实验准确率为79.35%,在Laptop数据集的三分类任务上实验准确率为73.39%,F1值也比其他基准模型更高。(2)针对方面级情感分类任务中数据集偏小限制模型性能的问题,提出一种基于多头注意力的迁移胶囊网络模型MATC(Transfer Capsule based on Multi-head self Attention)。模型利用迁移学习思想将文档级注意力知识运用于方面级情感分析任务上,并且通过多头自注意力提取全局特征弥补CNN只能捕获局部特征的缺陷。模型使用胶囊网络作为分类层,根据神经元向量的长度进行情感极性分类,更好地提升分类性能。通过实验证明,MATC的准确率和F1值均优于HCL-MHA模型。此外,我们还将模型中的文档级模块运用于微博僵尸粉甄别任务上。(3)针对方面级情感分类任务中的跨领域问题,提出一种基于BERT和域对抗机制的模型DA-BERT(BERT combined with Domain Adversarial)。该模型由BERT-SAN特征提取模块、情感分类器和领域分类器三部分构成。其中BERT-SAN是BERT堆叠self attention network构成,情感分类器只对源领域数据集进行分类,领域分类器通过域对抗实现源领域和目标领域的特征混合,从而实现模型的泛化。在由Restaurant、Laptop和Twitter三个数据集构成的6个跨域对上的实验表明了模型的有效性。
其他文献
近年来,物联网技术的发展以及智能手机的普及,从智慧医疗保健行业的发展看来,可穿戴设备潜力巨大。随着传感器技术的进步,用户可以利用可穿戴设备精确地对睡眠状况以及日常运动进行实时监控,可用于各种健康保健和预防性医疗。社会的医疗保健系统与人们的生活息息相关,而当下的医疗诊断主要还是依靠于实体医院,对于预防性健康医疗的需求较大,这使得可穿戴设备具有广阔的市场前景。可穿戴式设备作为未来个人健康检测的基础,将
计算机和通信系统与物理世界的快速融合,促进了工业信息物理系统(Cyber Physical Systems,CPSs)的出现。由于集成了控制、通信、传感和计算能力的工业CPSs对接口的要求更加开放,大量的网络安全威胁涌入到系统中,这引起了学者们对工业CPSs安全性问题的广泛关注。重放攻击是工业CPSs中一种常见的数据完整性攻击。虽然针对数据重放攻击的检测方案已取得一些成果,但是这些研究通常需要已知
GIS(Geographic Information System,GIS)是用于输入、存储、查询、分析和显示地理数据的计算机系统,它继承了地理、测绘、地图、信息、通信等众多的学科知识,是多种学科交叉的综合性技术。近些年来,伴随着地理信息系统的发展,人们对于地图数据信息的需求量越来越大。地图自动制图综合研究成为GIS领域的热点内容,是地图制图自动化的难点与发展方向。地图综合主要是根据制图综合的基本
智能体是人工智能的具体实现。在群体智能中,种群中的每一个个体都可以视为智能体,这些智能体根据某些规则决策下一次的搜索轨迹,以逼近优化问题的全局最优解。目前粒子群优化(Particle Swarm Optimization,PSO)算法及其变体已被证明是求解复杂优化问题的有效方法。在过去的20年中,PSO已引起了学术界的广泛关注。然而,粒子群算法在搜索过程中存在粒子位置振荡、多样性不足和易于陷入局部
磁共振成像由于其无辐射、多参数、对比度高等特性,被广泛应用到医学成像领域。但是其过长的数据采样时间限制了其应用。自磁共振成像技术被提出以来,各种用于提升成像速度的方法被提出,比如提高最大磁场转换率与并行成像等。而当前研究的一大热点是通过对k-空间数据进行欠采样来快速成像。理论上对k-空间欠采样可以成倍的加快成像速度,但如果采样频率低于Nyquist-Shannon定理,重建出来的图像就会出现严重的
近些年来随着深度学习的发展,基于图像的虚拟试衣技术获得越来越多的关注。目前利用深度学习算法实现虚拟试衣的技术主要有两个,一是基于CAGAN的,但是该网络生成的图像质量不理想,并且无法处理较大的空间变形,二是基于VITON的,但是在试衣前后的图像存在较严重的颜色失真、面对自我遮挡时生成效果不理想以及变形网络存在一些缺陷等。因此,本文对深度学习算法应用在虚拟试衣中出现的这些问题进行了研究和解决,本文的
近年来,人工智能在诸多领域都取得了重大进展,如生物医学、智能交通、智能家居等。医学图像处理是生物医学领域热门的研究方向之一,随着人工智能技术的飞速发展,尤其是深度学习的兴起,该问题有了新的解决方案。应用深度学习技术解决常见的医学图像处理问题已经取得了一定的进展,但仍存在以下挑战:1)医学图像的获取耗时长、花销大,某些图像的获取甚至会对人体产生伤害,如何避免这些限制获得充分的医学图像辅助医生诊断?2
目标跟踪是计算机视觉范畴内一项基础而重要的研究方向,在智能监控,公共安全,人机交互和自动驾驶等诸多科学和技术领域中,都有着广泛的应用。目标跟踪的主要任务可以简单概括为,在已知视频第一帧中某个任意物体具体位置的情况下,尽可能精确地定位出在该目标后续帧中的位置。在实际应用中,由于目标会不可避免地遭遇诸如尺寸变化、形变、运动模糊等干扰因素,因此,本文对基于孪生神经网络的跟踪算法进行了深入调研,并在此基础
随着我国汽车保有量的不断增加,城市停车难问题日益凸显,AGV智能停车库作为缓解停车难问题的新型解决方案,受到了越来越多的关注。在AGV智能停车库中,主要依靠停车AGV来运输车辆,因此AGV的路径规划与协同调度策略的好坏直接关系到停车库能否稳定高效地运行。本文以AGV智能停车库作为研究背景,主要研究AGV的路径规划算法与多AGV协同调度策略,同时为了提高系统的运行效率,对AGV电池充电问题与停车位资
行为识别是人工智能与计算机视觉领域最具挑战性的研究方向之一,在人机交互,医疗健康,智慧安防以及智能机器人等领域有着广泛的应用。行为识别技术的核心是通过聚合视频片段中每帧的预测信息从而实现视频级预测。尽管针对每帧图像的分类技术已经取得了很大的成功,但从二维图像的分类扩展到三维视频的识别仍然有一定的困难。因为从二维图像扩展到三维视频不仅因为计算复杂度的巨大提升,更需要捕捉视频中不同帧之间的时空上下文关