基于特征融合的中文隐式情感分析方法研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:HNLYLKT
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速发展,针对社会实事,社交平台上会出现大量的议论,这些议论文本存在数量大、话题多、结构口语化和语义信息不足的特点,特别是一些隐式情感语句,会存在暗讽、反话等语言方式,其情感特征并不明显,这些特点对传统的情感分析方法提出了较大的挑战,实验表明,单纯的文本序列信息无法满足隐式情感分析的需要。本文主要围绕着隐性情感的极性判别任务,在传统的仅仅依靠序列特征进行分类的基础上,通过引入语法结构和上下文信息,使二维的文本序列转变为高维的图结构,将文本映射为一张文本图,通过图神经网络进行图分类来实现对原始文本信息的分类。主要研究内容如下:(1)引入序列信息和依存句法信息的特征融合网络研究:本文提出了一种将文本序列特征和语法结构特征融合的网络(SDNN),对文本序列信息和句法信息进行抽提取,并在构建文本图表示过程中加以体现,最终通过对文本图的分类来实现对情感极性的分类。(2)引入上下文信息的特征融合网络研究:本文在SDNN的基础上,进一步融合了上下文文本特征,并以此提出了将三种特征融合的网络(CDHNN),通过模型将上下文信息也引入到图表示中,并最终来实现对情感极性的分类。(3)基于微博舆论分析方法的设计与验证:本文为了进一步验证所提出模型在实际应用中的有效性,提出了一种对微博舆论情感进行判别的方法,并将本文所提模型带入此方法,以验证模型的实际可用性。本文在SMP-ECISA2019竞赛所提供的隐式情感分析数据集上进行实验,以验证本文所提出模型的有效性,以BERT+LSTM做为基线模型,SDNN模型的准确率提升了1.6%,CHDNN模型的准确率提升了3.3%,可以看出,本文提出的基于特征融合的模型能有效提高隐性情感的发掘能力。
其他文献
据统计,2020年以来,我国境内捕获的恶意程序达261,603个,恶意软件的攻击造成的后果十分严峻。针对数量庞大的恶意软件,针对恶意软件的分类显得尤为重要,准确率更高的分类方法可以帮助我们更好的应对恶意软件的攻击。而随着恶意软件的不断进化,种类不断增多,传统的静态分类方法与动态分类方法已无法应对新兴的恶意软件,因此,本文采用多特征融合与深度学习相结合的方式,提出一种新的分类模型,经实验数据验证,分
学位
在光网络信号的传输过程中,长距离传输是一个非常重要的研究方向,光信号经过长距离传输会出现信号质量劣化的现象进而导致输出信号的光信噪比降低、接收端出现误码,所以为了提高信号的质量在长距传输中一般会加入掺铒光纤放大器、拉曼放大器、遥泵等设备和添加前向纠错码。通过使用前向纠错码能够以较低的代价提升信号的传输距离,现有的前向纠错码应用的环境基本为2.5Gbit/s速率以上的光传送网中,而千兆速率的以太网帧
学位
随着国内经济的稳步发展及车辆制造科学的不断进步,机动车保有量逐年增加,各个城市的交通问题逐渐显著,如何有效地将通信技术与信息技术相结合去解决交通拥堵的问题已经成为了当今时代的重要课题。交通流预测已经成为了一个热门的研究课题,国内外越来越多的学者投入到该领域的研究之中。近十年内,世界各国的研究学者提出了很多种不同的交通流预测方法,但绝大部分方法都是在时序层面对其进行预测,对交通流量空间相关性的研究不
学位
为了厘清新的气候期(1991-2020年)陕西北扩区苹果气候适宜种植区的精细化分布,揭示该区域苹果可发展种植潜力,本文基于陕西苹果产区气象观测、数字高程模型、耕地确权等多源数据资料,综合考虑陕北山地苹果种植的气候与立地条件需求,选取年平均气温、年降水量、6-8月空气相对湿度、6-8月平均最低气温、1月平均气温、坡向、坡度共7项因子作为区划指标,采用多元回归方法进行各气候因子空间化模拟推算,基于模糊
期刊
作为人机交互的关键技术,语音合成是人工智能领域的重要研究方向之一,基于深度学习技术的语音合成方法也日益成熟,其核心是建立文本到语音的非线性关系模型,实现文本序列和语音频谱帧的特征映射关系。然而当前主流的语音合成模型面临着高质量单一音色训练数据需求较大和供给不足的矛盾以及当合成长文本时出现的重复读音、遗漏读音等鲁棒性问题。针对语音合成领域当前存在的高质量单音色语料缺乏和长文本合成鲁棒性较差的问题,本
学位
中文公司名实体识别是命名实体识别的一个细分领域。中文公司名实体识别是对企业的曝光率、知名度、运作状况等信息进行自动化分析的基础,在新闻、财报的自动化分析中具有重要意义。但是,目前的中文公司名识别遇到了很多难点,导致识别率偏低。本文针对这些难点,分析了各个模型的优劣,并针对性地搭建了测试语料库。本文的主要工作如下:(1)针对中文文本缺少分隔符以及中文一词多义现象常见的情况,本文使用BERT词向量模型
学位
三维人脸重建技术在信息安全、日常生活中的应用已经得到了广泛部署,同时解决由于生成时间复杂度、三维点云数据质量等因素,影响三维人脸生成质量的问题仍然是一个技术难点,本文针对现有三维人脸重建算法存在的问题展开研究,具体研究内容如下:(1)针对现有三维人脸重建算法中,由于三维点云数据不密集,造成三维人脸生成质量不佳的问题,本文提出了区域色彩迁移算法。该算法先标注色彩填充区域,并在标注区域内部对填充色块进
学位
肌电模式识别是一种先进的智能信号处理技术,已被认为是一种可靠的用户意图分类的重要方法。目前相关的研究报告了在实验室里的高分类正确率,但在临床应用方面仍不能令人满意。其中一个重要的原因是,EMG-PR方法的稳健性仍然不够强,无法应对许多问题,如日常使用中的电极移位,肌肉疲劳,以及力度的变化。其中,力度的变化是影响EMG-PR方法性能的关键问题。因此,提高肌电模式识别方法的抗力变化的鲁棒性就显得尤为重
学位
为了让人们能够从大量的文本信息中准确地获得关键性的内容,文本摘要技术被广泛关注。随着自然语言处理和深度学习技术的发展,很多基于深度学习的文本摘要方法被提出。本文通过对现阶段文本摘要模型进行研究,发现了针对中文的文本摘要模型会出现割裂语义,生成摘要不通顺,冗余信息过多,无法有效处理长句的问题。针对以上问题本文提出了一种抽取-生成式中文文本摘要模型,具体研究工作如下:(1)本文构建了适应中文的基于改进
学位
由于雷达设备具有不接触性和信号保密性高等特点,使得雷达设备被广泛应用在居家养老、探测、搜救等领域,因此应用环境对雷达信号的处理提出了很高的要求,传统的信号时频滤波和特征提取,需要从时域变换到频域,再反变换到时域,这样的流程不利于并行操作,存在时间的滞后,本文提出了一种基于超宽带雷达的双通道输入跌倒信号检测方法,避开复杂的信号处理过程,只在回波信号时域的通道上做一次快速傅里叶变换和一次奇异值分解,在
学位