基于Transformer的文本情感分析应用实践

来源 :客联 | 被引量 : 0次 | 上传用户:sukeyjuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:文本情感分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。本文先介绍文本情感分析的本质和任务,然后引入Transformer并进行其结构、原理和位置编码概念介绍;最后对整个项目结构关键部分进行模块分析和功能说明。
  关键词:深度学习;Transformer;文本情感分析;多头注意力机制
   自然语言处理NLP的一项重要处理就是情感分析Sentiment Analysis,它在社交内容的分析以及电商评论反馈分析中,都占有很高的分析价值。文本情感分析任务本质是自然语言序列的特征提取和基于特征的分类问题。相比于生成类NLP任务,文本情感分析任务的核心是自然语言特征的提取。文本特征提取一直是NLP主流的研究方向,从RNN到AutoEncoder再到BERT都是在特征提取方法上进行改进的。本文将Transformer的Encoder作为特征提取器,然后接上全连接的神经网络进行分类拟合,根据拟合结果判断情感倾向。接下来我们先介绍一下Transformer相关理论知识,以便能够更好地理解模型结构的设计。
  一、Transformer简介
   Transformer结构是谷歌在《Attention is all you need》论文中提出的。论文中提出的transformer这种新的结构,将其应用在机器翻译的领域上,取得了很好的效果。自从Attention机制在提出之后,加入Attention的Seq2Seq模型在各个任务上都有了提升,所以现在的seq2seq模型指的都是结合rnn和attention的模型。但传统的基于RNN的Seq2Seq模型难以处理长序列的句子,无法实现并行,并且面临对齐的问题。
  二、Transformer原理
   (一)Transformer的基本结构
   从设计结构上看,Transformer延续了Seq2Seq的Encoder-Decoder 结构:对输入的数据进行Encoder编码提取特征,然后将Encoder的输出和标注数据一起输入Decoder,最后计算字典内每个词的出现概率,选取最大概率对应的词作为最终输出。在Transformer结构中, Feed Forward是前馈神经网络层,其作用是将Multi-headAttention(多头注意力)层输出的数据进行非线性变换后输出。其结构如图1所示。
   (二)多头注意力机制
   注意力机制由来已久,从结构特点来看大致分为软注意力(Soft Attention)机制、硬注意力(Hard Attention)机制、全局注意力 (Global Attention)机制、局部注意力(Local Attention)机制和多头注意力(Multi-head Attention)机制。这里重点介绍和Transformer结构密切相关的多头注意力机制。
  多头注意力机制是在Attention Is All You Need论文中提出的,多头注意力是由多个Scaled Dot-Product Attention(放缩点积注意力,点积是我们常用的计算相似度的方法之一,放縮指内积的大小是可控的)堆叠而得到的。与常见的注意力机制相比,放缩点积注意力机制主要是在相似计算和内积调节控制方面进行了改进。放缩点积注意力的计算过程大概是这样的:首先计算每个Q与K矩阵的相似度,然后使用softmax对相似度向量进行归一化处理得到 权重,最后将权重向量与V矩阵加权求和得到最终的attention值。Q与K的相似度计算过程是这样的:首先使用MatMul函数计算Q和K的相似度(MatMul是一种点积函数)。为了能够更好地控制计算 的复杂度,使用Scale函数对MatMul的计算结果进行缩放。
   多头注意力其实就是每一次放缩点积注意力的计算结果,那么计算多次就是多头注意力。在每次计算时Q、K、V使用不同的参数进行线性变换,这样虽然进行了多次放缩点积注意力的计算,但每次计算的结果是不同的。对输入数据进行不同的线性变换操作是特征增强的一种手段,因为至少从理论上增加了有效特征,可以提高神经网络模型的预测效果。
   (三)位置编码
   在Transformer结构中没有使用任何RNN或其变体结构,这样Transformer就存在一个天然的缺陷:没有办法提取序列的位置顺序特征。我们知道自然语言的数据是有时序性的,一个词在句子中出现的 位置不同可以导致整个句子的意思完全不同。为了解决这个缺陷,在Transformer结构中使用了位置编码(Positional Encoding)来提取各个词的位置信息,并作为Encoder或Decoder的输入。Transformer位置编码的实现方式是:通过正余弦函数交替编码提取位置信息,然后将所提取的每个词的位置信息与每个词的 Embedding输出相加作为Encoder或Decoder的输入。正弦函数编码能够更好地体现不同词之间的位置关系,因为对于正弦函数来说,在一定的范围内变化可以近似于线性变换。
  三、项目工程结构设计
   整个项目工程结构分为两部分:文件夹和代码文件,在编程实践中建议采用文件夹和代码文件的方式来设计项目工程结构。所谓的文件夹和代码文件的方式是指把所有的Python代码文件放在根目录下,其他需要存放的静态文件、训练数据文件和模型文件等都放在文件夹中。
   本项目分为五个部分:配置工具(getConfig.py)、数据预处理器(data_util.py)、神经网络模型(textClassiferModel.py)、执行器(execute.py)和应用程序(app.py)。配置工具提供通过配置文件来全局配置神经网络超参数的功能;数据预处理器提供数据加载功能;神经网络模型是由Transformer的Encoder部分和全连接神经网络组成的网络结构;执行器提供保存训练模型、预测模型等功能;应用程序是一个基于Flask的用于人机交互的简单Web应用程序。在文件夹中,model_data存放训练导出的模型文件;train_data存放训练数据;web_templates存放HTML、JS等静态文件。    (一)配置工具类实现
   在实际的项目中,我们往往需要对参数进行频繁的调整,因此可以定义一个工具类来读取配置文件中的配置参数,这样在调参时只需要对配置文件中的参数进行调整,即可实现对全部参数的调整。
   (二)数据预处理实现
   数据预处理中需要实现的功能比较多,包括word2num、字典的生成、输入数据和标签数据的处理、npz文件的保存等。
   (三)神经网络模型设计
   在神经网络模型实现中,根据实际需要我们只实现了Transformer的Encoder部分,把这部分的输出作为对文本信息的提取输入到一个全连接神经网络中进行文本分类任务的训练。
   (四)执行器实现
   执行器实现的是模型创建、训练模型保存、模型加载和预测的功能,因此在编程实践中我们定义了create_model、train和预测函数。
   (五)WEB应用实现
   Web应用主要完成页面交互、图像格式判断、图像上传以及预测结果的返回展示。这里我们使用Flask这个轻量级Web应用框架来实现简单的页面交互和预测结果展示功能。
  四、結论
   Transformer是第一个用纯attention搭建的模型,不仅计算速度更快,在翻译任务上获得了更好的结果,也为后续的BERT模型做了铺垫。但也有一定的缺点,比如有些rnn轻易可以解决的问题transformer没做到,例如复制string,或者推理时碰到的sequence长度比训练时更长(因为碰到了没见过的position embedding),总的来说Transformer结构是一个创新的结构,在大多数NLP处理方面表现非常优秀。
  
  参考文献:
  [1] 张冬瑜等.基于Transformer和BERT的名词隐喻识别[J],数据分析与知识发现,2020(3).
  [2] 张宇等.融入注意力机制的深度学习动作识别方法[J],电讯技术,2021(4).
  [3] 闫涛. 深度学习算法实践 [M]. 电子工业出版社出版社,2020.
  [4] 王宇石等.一种基于卷积神经网络的违禁品探测系统及部署方法[J],科技创新与应用,2020(7).
其他文献
摘 要:本文主要介绍CRH5G型动车组轴温系统,对CRH5G型动车组DZ-5型轴温系统进行详细介绍,对轴温系统的常见故障原因进行了分析,通过对故障的分析及梳理提供了轴温故障的快速解决方案,提前发现并解决隐性故障,对提升动车组运用的可靠性有极大的帮助。  关键词:CRH5G型动车组;轴温系统;隐性故障  一、组成及工作原理   1、DZ-5型轴温系统   ①组成:DZ-5-F型轴温主机、DZ-5
期刊
摘 要:本文从巴盟面精的称谓及来源、食材、制作工艺、推广四个部分进行了初步探讨,旨在提高民族特色菜肴的保护、传承意识, 使其与时俱进丰富民族饮食文化的内涵。  关键词:面精;巴盟;小吃;制作;食材      巴盟,内蒙古自治区巴彦淖尔市从前的简称,撤盟建市后巴盟由“盟”改为“市”。河套平原又称后套平原,位于内蒙古高原中部黄河沿岸,西到贺兰山,东至呼和浩特市以东,北到狼山、大青山,南界鄂尔多斯
期刊
摘 要:近年来,随着城市化的不断发展,农村中大量的土地被征用,农业用地不断地变为工业用地,耕地面积不断减少。对于国家来说,粮食是国民经济的命脉,土地是国民经济的压舱石。对于农村居民来说,土地是其生产和生活中必不可少的生产资料,一旦失去了土地,就失去了收入来源,失去了生活的保障,失去了抗击风险的能力。因此,国家应该关注的问题是如何处理征地与征地补偿金的问题,如何保障被征地后农民的生存问题,以及这部分
期刊
摘 要:机电安装工程本身也在建筑工程中发挥着重要的作用。只有合理地利用机电安装流程,才能够更好地保证建筑工程本身的质量。作为一个非常复杂的管理工作采用机电技术,需要有关工作人员具备高技能和其他专业知识。机电安装质量是影响机电工作的重要因素,是施工管理技术的重要部分,将对所有机电设备的安装质量,以及随后的发展产生重大影响。本文阐述了机电安装施工技术要点,分析了机电安装工程施工管理技术现状,探讨了提高
期刊
摘 要:随着我国人口的增加,目前我国基层事业单位档案数量较多,管理难度也日渐增大,档案管理人员需要面对的挑战与困难也日渐严峻,为了基层事业单位档案的良好发展,需要对其进行信息化操作,将现代化科学技术理念与档案管理进行合理结合,以此保证相关人员对档案管理的工作效率,并且单位工作人员的档案也要跟随单位的改制、合并进行调整,对于一个企业而言,档案管理十分重要,做好档案管理有利于领导了解员工的个人信息,能
期刊
摘 要:俗话说,食之于人。粮油储存(GADC)解决了人类对粮油的需求,让各国人民获得了基本的生存自由。人心的安宁是世界发展的基石;粮油贮藏(GADC)与国家的温饱问题息息相关,是社会稳定和国家发展的根本条件。因此,我们需要更加重视粮油的储藏功能。笔者详细介绍了粮油贮藏(GADC)的材料和方法,旨在为GADC开发建设提供坚实的保障。  关键词:粮油储藏(GADC);安定;存储方式   以储存粮油为目
期刊
摘 要:封建社会的婚姻制度是封建经济关系以及建筑在此基础上的政治制度、法权制度和道德风俗等综合产物,处于封建社会上升、繁荣时期的唐代,“和离制度”正式写进唐律,乃是我国古代史上的第一次。作为封建社会法律代表的《唐律疏议》,对于这一时期的婚姻编撰有专门的法条规定,其既具有开放性又有封建性,对当代婚姻家庭关系有其启示意义。  关键词:唐代;婚姻;制度;风俗   唐代是我国封建社会的繁荣时期,不仅表现
期刊
摘 要:创新是引领经济发展的第一动力。当今世界互联网高速发展,发展的核心动力便是创新,创新能力事关一个民族,一个国家,一代人的长久而持续发展。因此开展创新创新教育在今天这个时代显得格外重要。国家经济转型期要求高职院校开展此类教育。我国正处在经济转型的关键时期,产业结构、消费升级、区域经济发展不平衡等问题都逐步显现出来。  关键词:自媒体;社会主义核心价值观;大学生  一、高职院校实施创新创业教育的
期刊
摘 要:随着互联网时代的进一步发展,网络营销成为当代市场营销发展过程中必不可少的环节,“双11”、“双12”购物节的网上交易成交量每年剧增,因此,立足于当代网络消费的现状,了解在网络消费过程中消费者可能会出现的消费心理,通过分析消费心理学对网络营销策略带来的影响,可以基于消费心理学制定更加完善的网络营销策略,达到助力网络营销水平的提升的目的。  关键词:消费心理学;网络营销;营销策略探析   网
期刊
摘 要:大数据正在为安全策略提供新的可能性,对海量数据的分析有助于更好地跟踪网络异常行为,对实时安全和应用数据结合在一起的数据进行预防性分析,可防止诈骗和黑客入侵。  关键词:大数据;信息;安全策略  一、大数据的基本概念   大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。”业界通常用4个V(即Volume、Variety、Val
期刊