基于大规模预训练模型的情感分析问题研究

被引量 : 0次 | 上传用户:smoking11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析旨在利用信息技术挖掘文本背后所表达的情感与态度,是自然语言处理中重要的任务。情感分析能够分析文本背后对于商业商品、社会实践、机构、公共话题的看法与态度,有着重要的科研价值与社会价值。近年来,大规模预训练模型成为自然语言处理中的里程碑式创新,其能产生结合上下文的词表征,同时通过大规模无监督预训练存储了大量的语义知识。在情感分析相关的诸多任务中,大规模预训练模型均明显地提高了准确率,但仍然存在领域自适应、语法知识缺失、句子级文本表征不足等诸多问题。本文针对这些问题进行深入研究,提出了对应的创新性解决方案,论文的主要贡献如下:(1)基于大规模预训练模型的跨领域情感分析。大规模预训练模型是通过大量的、无标签的通用日常语言来预训练的,对于其他领域如文本评论数据领域具有领域知识差异。同时预训练模型也缺乏跨领域情感分析中所需的辨别领域知识的能力。为了解决这个问题,本工作提出了领域辨别预训练任务与情感增强预训练,通过无监督的后训练的过程,为大规模预训练模型融入领域感知与情感知识。结合对抗训练,本文的方法在多个数据集上取得研究当时一流水平。(2)基于图卷积神经网络的语法增强模型。细粒度情感分析要求对文本中的不同实体进行情感倾向性判断,很多情况下,同一句文本中含有多个目标实体,其对应的情感词也可能会有不同的极性。在这种情况下,语言的语法结构信息能够帮助模型定位实体所对应的情感词,具有重大意义。然而,现有的大规模预训练模型与预训练任务缺少对于语法知识的建模,为此,本工作提出了基于图卷积神经网络的语法增强模型,以字符作为节点,根据句法依存树转化成的邻接矩阵,为预训练模型引入了句法限制以及长距离依赖信息。除此之外,本文还设计了针对语法类型的门机制,实现了语法结构与类型的双感知。多个数据集上的实验表明本文方法达到了研究当时一流水平。(3)基于对比学习的句子级表征预训练。在现有的大规模预训练过程中,字符级别的预训练占主导地位,句子级别的预训练仅仅在语言连贯性层面,不足以生成具有内容辨别力的句子级特征。为了解决这一问题,本文根据用户点击的新闻文本数据,设计了用户行为协同规则,对于内容相似与不相似的正负样本,在句子级别上进行了对比学习预训练。特征可视化实验表明,经过大规模对比学习预训练后,预训练模型对于不同类型的新闻文本实现了很好的区分,产生了具有内容辨别力的句子表征。在新闻推荐任务中,本文提出的模型很好地对用户的新闻兴趣和情感倾向进行建模,达到了研究当时的一流水平。(4)基于胶囊网络的细粒度情感分析模型。细粒度情感分析旨在分析文本中不同实体目标的情感倾向,最大的挑战是多种不同情感倾向的实体目标混在同一句文本中,情感特征互相重叠与干扰。为了解决这一问题,本文引入了胶囊网络,通过向量化神经元输出以及聚类式的动态路由算法,实现了对于不同实体的情感特征的聚类。除此之外,本文为基于EM算法的动态路由过程引入了交叉注意力机制,构建了实体目标与主体文本之间的语义关系。多个数据集上的实验表明,我们的方法超过了基线模型,达到了研究当时的一流水平。
其他文献
教育大计,教师为本。做好师德师风建设,是打造高素质教师队伍的重要保证,是践行立德树人根本任务的重要基础。立足高职院校教育工作实际,全面分析当下高职院校师德师风建设的最新实践成果,从抓源头、管过程、促成果的视角,构建严、立、树、育、导“五位一体”的师德师风建设长效机制,逐步探索高职院校师德师风建设的具体做法,真正将高职院校师德师风建设落到实处。
期刊
胰高糖素样肽-1受体激动剂(GLP-1RAs)除具有很强的降糖作用外,也具有很强的心血管保护作用。随着心血管结局研究结果的公布,GLP-1RAs也被证实可显著改善2型糖尿病患者合并动脉粥样硬化性心脏病的远期风险。本共识针对GLP-1RAs药理学、心血管保护机制、循证医学证据、临床应用建议、不良反应及注意事项等临床问题给出具体的推荐意见。
期刊
流浪动物管理关乎公共卫生、社会治安,是一个城市文明程度的具体表现,是每个城市亟待解决的民生问题。本文详细探讨了当前社会流浪动物管理现状,结合农业农村部门职责职能,分析存在问题并提出可行性建议,为政府进一步加强流浪动物管理提供参考。
期刊
报纸
脑卒中具有高发病率、高致残率、高死亡率的特点,脑卒中与糖尿病息息相关,二者常伴随发生。近年来发现胰高血糖素样肽-1受体激动剂(GLP-1 receptor agonists, GLP-1 RA)应用于2型糖尿病合并脑卒中的患者可以有效改善其脑血管结局,提示GLP-1 RA在脑卒中的预防和治疗领域存在应用潜力。多项研究表明,GLP-1 RA可以通过降低脑卒中危险因素、保护脑组织、改善认知等机制来发挥
期刊
报纸
报纸
以卷积神经网络和Transformer为代表的深度神经网络极大地推动了深度学习的发展,但其缺乏可解释性的黑盒性质也限制了相关模型在高可靠性要求等场景的应用。已有的深度学习模型解释方法或仅提供在局部输入空间或局部模型结构上的解释,缺乏对完整模型的解释;或使用模型无关的解释方法在完整输入空间或者模型结构上提供全局解释,缺乏对模型相关性质如与参数、结构相关的分析。本文借助图像风格化任务来探究卷积神经网络
学位
报纸
报纸