基于文本分段的问答型情感分析任务研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:virtualboxscdl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,各大网站充斥着海量文本信息。问答型情感分析任务旨在从电商评论、微博动态、知乎问答等用户交互的问答对中,挖掘其情感态度。
  目前问答型情感分析任务的处理方法,会将问题和回答文本切分为不同句子,对每个句子单独编码,忽略了句子之间的联系,造成了信息损失。为了解决这个问题,提出了分层循环注意力(Hierarchical Recurrent Attention, HRA)模型,在文本切分后,使用RNN(Recurrent Neural Network)对句子内部特征编码,使用自注意力机制对句子之间特征编码,根据每个句子的重要性,将句间特征以一定权重添加到句子内部的每个单词上,共同表示整个文本。此外,针对问题和回答对的信息匹配,采用双向注意力,学习问题和回答之间的交互特征。
  BERT(Bidirectional Encoder Representation from Transformers)在自然语言处理领域的很多任务上取得了顶尖的效果,但对输入长度有限制,导致其处理过长文本时需要对句子截断,造成信息损失。为了解决这个问题,提出了基于文本分段的分层BERT注意力(Hierarchical BERT Attention, HBA)模型,首先将长文本切分为BERT能处理的多个短句,使用BERT提取每个短句的完整特征。然后使用自注意力机制,将每个短句的特征作为基本单元,获取所有短句之间的联系,让编码后的总体特征表示整个长文本,有效利用长文本各个部分的信息。
  为了验证HRA与HBA模型的有效性,在三个电商问答型情感分析数据集上进行了实验。从实验结果可以看出,HRA能有效解决现有方法中句间信息损失的问题,且比不进行文本分段的RNN速度更快。HBA模型能在限制BERT输入长度时,仍能取得非常好的效果。
其他文献
结核病,特别是耐多药结核病,仍然是一个巨大的公共卫生威胁。硫化氢(H2S)是目前在结核分枝杆菌(M. tuberculosis)的病理生理学中出现的一种重要的气体介质。结核分枝杆菌Rv3340(metC)基因在甲硫氨酸生物合成中的倒数第二个步骤是将半胱氨酸分解为同型半胱氨酸,这个过程会产生硫化氢。  我们在耻垢分枝杆菌中克隆并表达了结核分枝杆菌Rv3340(metC),然后以半胱氨酸、硫酸盐、抗生
重金属污染已成为当前环境所面临的主要潜在威胁之一。其中六价铬(Cr(VI))相对于其他金属离子,在水体中拥有较大的溶解度和迁移性,使其污染的传播能力更强,污染区域范围更广。近年来,随着电镀、皮革等工业的快速发展,含有六价铬的大量工业污染物被直接排放到环境当中,使六价铬可通过水体及食物链的累积等途径进入人体,对消化系统、肝、肾等器官都能构成巨大的生物损伤。传统的六价铬污染处理方法主要包括两大类:一是
随着石化燃料的日益枯竭,以及对环境保护的愈加重视,发展新能源汽车迫在眉睫。以超级电容器作为动力源的新能源汽车,目前还处于发展阶段。超级电容器最重要的组成部分是电极、电解液和隔膜。对超级电容器的研究绝大部分集中于对电极材料的研究。钙钛矿材料由于特殊的晶体结构,具备很多独特的理化性质,因此在太阳能电池、燃料电池等领域已经开展大量研究,而将钙钛矿材料引入到赝电容超级电容器中,还是个全新领域。  本文以阴
气膜冷却是现代航空发动机技术中比较重要的方面,气膜冷却因其固有的高效冷却特性成为航空发动机热端部件的主要冷却措施之一,其中发散冷却是目前引起广泛关注的一种冷却方式,其主要特征是被冷却壁面上的气膜孔更加密集,可以在燃气侧壁面附近形成相对完全覆盖的气膜层。本文针对发散冷却的特点,围绕提高气膜冷却效率的目标,对发散冷却结构进行改进,以期获得冷却效果更好的冷却结构。主要研究内容包括:针对平底形横向波纹壁面
发动机燃用天然气-柴油双燃料取代纯柴油是解决能源短缺和降低排污染的有效措施.该文分析了双燃料发动机的发展水平与现状,研制了进气管混合器式燃料供给系统、进气管阀喷射式燃料供给系统及阀喷射式电子控制喷气系统,并分别装机进行了性能试验.在整机性能特别是废气排放方面将混合器式和阀喷气式双燃料发动机与原柴油机进行了全试验分析对比,特别对燃料发动机采用不同混合器、不同供气方式以及废气再循环时的排放特性进行了分
列车自动驾驶(Automatic Train Operation,ATO)技术与整个铁路系统的运营效率及性能密切相关,是轨道交通领域的研究热点之一。目前,对于ATO技术的研究主要集中在两个方面:目标速度曲线的优化和对优化曲线的跟踪控制。在综合考虑节能性、准点性、舒适性及安全性等指标要求计算生成目标速度优化曲线后,设计高性能的列车速度跟踪控制策略,实现高速列车对目标曲线的精确跟踪,就成为达到列车运行
学位
为了确保不同种易燃危险物体以及延伸管道结构的安全性,本文提出了由超声波导和微控制器建立的管道防火控制系统,并对其可行性进行分析。如今,用于监测泵站外部延伸管道部分的消防安全设备还十分稀少,这正是本研究主要解决的关键问题。文中对已有的设备结构进行详细分析与对比后,选定由柔性耐热线制成的超声波导为敏感元件,并使用物理现象驻波作为该监测器的工作原理。本文制定了技术规范,创建了电气结构和电气功能图,并在此
用户通常通过应用市场获取Android应用来满足生活娱乐需求,现有大量为Android用户提供应用下载服务的第三方应用市场。为争取用户,应用市场通常对进入市场的应用进行严格的审查,尽可能让用户获取安全的应用。为提高用户使用体验,各大应用市场急需一套自动化的方案来避免应用中出现一些影响用户体验的流氓行为,例如诱导用户点击和下载应用的流氓广告,不能正常关闭的流氓弹框和干扰用户的流氓悬浮窗等。  目前应
学位
推荐系统在各大在线服务中具有广泛的应用场景,它的作用在于基于用户的兴趣为其推荐相匹配的项目,提升用户体验的同时也为系统带来更多的收益,实现用户与系统的双赢。基于深度学习的推荐算法是一个热门的研究方向,这些方法将特征映射为低维度的隐向量,但它们无法精准的衡量隐向量之间的相似关系。推荐系统中的信息之间存在关联关系,依据这些关系可以构建出图网络。采用网络表示学习方法可以提取图中的非结构化信息,丰富特征隐
学位
Android系统占据了智能终端系统的大部分份额,吸引了恶意应用开发者,对用户构成安全威胁。现有检测方法主要判断恶意代码存在性并分析恶意家族。然而,混淆技术会改变应用特征,恶意开发者利用该技术,生成恶意应用混淆变种,可以绕过现有检测方法,显著降低检测准确性。  针对Android恶意应用混淆变种,设计和实现了一种高效且抗混淆的Android恶意应用检测系统AOMDroid。针对不同混淆技术,AOM
学位