基于短文本深度学习的目标属性情感分析技术研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:gzbfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了基于短文本深度学习的目标属性情感分析技术,包括目标属性抽取算法和目标属性情感分类算法。在目标属性情感分析领域,当前的深度学习模型仍然存在一些问题,比如目标属性抽取模型不能充分考虑上下文词语的语义关联和预测标签之间的约束关系;目标属性情感分类模型对复杂文本特征表达能力不足以及无法充分利用文本中不同目标属性的情感关联信息等问题。本文针对上述问题,从模型架构等方面对深度学习方法在目标属性情感分析任务中的应用进行改进和完善,研究了三种目标属性情感分析模型。
  本文首先研究了一种目标属性信息融合的记忆网络方法,目的是为了解决传统的循环神经网络中复杂句式特征表达能力不足和无法充分利用外部特征的问题。该模型采用记忆网络思想,利用目标属性、词语位置等外部的辅助信息增强网络的特征表达能力。通过实验证明,本方法相较于仅使用注意力的网络或者无目标属性特征融合的网络,能够有效的提高情感分类的精度。
  同一个文本中不同目标属性的情感倾向是相关联的,但现有的目标属性情感分类模型大都是针对单一目标属性分别进行情感判别,这忽略了目标属性之间的关联性。为利用目标文本中多个目标属性的关联信息,本文研究了一种新颖的多目标属性信息关联的情感分类算法,该模型由单目标属性情感特征抽取网络和多目标属性情感特征融合网络两部分组成。实验证明,该方法能够有效的利用不同目标属性之间的关联信息,提高情感分类网络的性能。
  在前述的两个研究中,语料库的目标属性大都是通过手工标注的,这需要大量的人工劳动,并且带有很强的主观性。本文进一步研究使用神经网络模型抽取目标属性。当前大多数的研究工作将目标属性提取作为一种序列标注任务,但是已有的网络模型没有充分考虑标注词语之间存在的语义关联和预测标签之间的约束关系。针对此,本文研究了一种基于历史信息的目标属性抽取方法。实验证明,该方法在一定程度上能够提高目标属性抽取网络的性能。
  总体而言,本文在目标属性情感分类和目标属性抽取两个子方向进行了探索和研究,效果较为明显,未来可将该技术应用于网站评论数据分析、用户观点挖掘等领域。
其他文献
由于海水中存在着蓝绿光低损耗窗口,且光通信带宽较大,所以可见光通信成为水下短距高速数据传输的主流方案。然而,目前的发光二极管调制带宽往往只有几MHz,限制了可见光通信速率的进一步提高。多输入多输出(Multiple Input Multiple Output,MIMO)技术可以通过空间复用并行传输多路数据,提高通信速率。所以,将MIMO技术与可见光通信相结合,建立光MIMO通信系统,提高系统容量,
下一代的射电望远镜,如我国作为核心成员国正在进行建设的平方公里阵列射电望远镜,将以其前所未有的灵敏度和分辨率获取射电图像,彻底改变我们对宇宙的理解,极大程度推动人类在天文领域的科学研究。在这一背景下,需要有效的成像方法来处理大数据量的射电图像。传统的算法如洁化算法和最大熵算法得到的重构图像质量有限,对于大规模数据的效果不佳,已经越来越不能满足如今的需要。因而本文旨在研究一种能够有效克服大规模数据处
学位
超分辨率重建技术能够突破数字成像系统的限制,能以低廉的成本有效地提高图像的分辨率和视觉质量,已广泛应用于诸多领域,如安全监控、医疗影像应用、卫星遥感图像等等。近年来,深度卷积神经网络在超分辨率重建上的应用获得了令人印象深刻的性能。但目前基于深度卷积网络的超分辨率重建的方法,仍存在对图像高频细节重建不足,网络模型参数规模过大等问题。为了进一步恢复图像中的细节纹理来提高重建图像的质量,本文将注意力机制
现有路径规划算法大多基于路网,在用于求解数字高程模型(Digital Elevation Model,DEM)下的路径规划时,因数据量大,效率低下。  针对上述问题,本文基于真实地形数字高程模型,在研究现有启发式寻路算法的基础上,给出了相应的解决思路与方法,具体工作如下:  (1)给出一种基于改进遗传与蚁群算法相结合的DEM路径规划算法。针对遗传算法和蚁群算法在 DEM 数据下进行路径规划时的效率
近年来无线传感器网络开始广泛应用于各类生产生活当中。通过安放在监控区域内的传感器节点,可以对周围环境中的物理信息进行感知并收集其相关数据,这些数据经过分析之后,能够有效地检测出该区域内发生的各类异常事件。在现有的无线传感器网络异常检测方法中,一般需要已知异常数据的统计模型或者其他相关参数,但在实际应用中这类信息往往不容易获得。此外,随着监控区域的不断扩大,需要部署的节点数量也相应增加,采集到的数据
Hash函数作为信息安全领域中一个重要的研究分支,被广泛用于数字签名方案、数据完整性检测以及区块链等方面。自2012年Keccak算法被选为美国新一代Hash算法标准SHA-3以来,其安全性一直备受关注。本文基于Keccak算法核心部件的性质研究,利用代数特性对Keccak算法进行了线性化分析,并给出了新的区分攻击方法,主要成果如下:  1.给出了Keccak-f的5个逆变换,并探究了核心部件的特
学位
近几年以小型无人机为代表的低空飞行器发展迅猛,由于廉价、易操控、不易被探测的特性,安全性能差,对人们的生命构成了威胁,因此无人机的检测与识别问题成了亟待解决的问题。基于无人机“低小慢”的特点,以及雷达具有全天候、全方位工作等探测优势,用雷达检测与识别小型无人机无疑是一个很好地选择,可以实现低成本高精度的无人机检测与识别。研究雷达检测与识别无人机时特征提取方法变得尤为重要,特征的优良直接影响检测与识
目的:评价~(18)F-脱氧葡萄糖正电子发射体层摄影术(~(18)F-FDG PET-CT)在预测肝癌肝移植术后肿瘤复发及判断预后中的临床应用价值。方法:回顾性分析我院100例肝癌肝移植受者术前PET-CT显像~(18)F-FDG摄取高低与肝移植术后无瘤生存率及肿瘤复发的关系。结果:65例(65%)肝癌肝移植受者术前PET-CT阳性(~(18)F-FDG摄取明显增高),35例(35%)呈阴性(~(
近年来,蜂窝车联网(Cellular-Vehicle to Everything, C-V2X)使得车辆与周围环境以及云端互联,达到降低事故率与优化交通效率目的,如何有效地协调干扰、分配资源、选择最佳通信模式成为提升蜂窝车联网性能的关键。本文以蜂窝车联网作为研究对象,主要研究了如何对该网络进行干扰协调管理,并采用协作通信策略降低网络中的能量消耗以及收到信息的错误概率。本文对蜂窝车联网的研究主要工作
近年来,随着人工智能及其细分领域的不断发展,人们对摘要器、信息抽取系统等文本生成器产出结果的自动评价研究产生了极大的兴趣。与此同时随着科技不断发展,高校逐步开始采用计算机来进行辅助教学,借助计算机来缓解由于师生比例不足带来的教学压力,如英语教师对学生作文的批改压力。在这样的背景下人们开始研发英语短文的自动批改系统,从单词语法的准确性、主题的偏离度、句法的复杂性等方面来对文本质量进行分析。语篇连贯质