基于主题增强神经网络的社会情绪分类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lymoso
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网时代,在线新闻的产生与传播变得非常迅速,如何及时又准确地预测新闻舆情成为了当今社会不可忽视的问题。文本社会情绪分类技术在近些年受到了学术界的广泛关注。社会情绪分类旨在从新闻文本出发预测大量读者阅读该新闻后的情绪分布,如高兴、悲伤、厌恶等。本文研究基于主题增强神经网络的社会情绪分类方法,具体包括以下三个方面的内容:(1)提出一种基于主题语义融合特征的社会情绪分类方法:该方法的核心思想是提出了一种融合门机制,以在社会情绪分类中融合并利用文本主题特征和文本语义特征。其中,对文本语义学习,我们提出了一种依存句法感知的递归神经网络来利用句子的依存句法知识;对于文本主题学习,该方法使用LDA主题模型提取文档主题分布,并利用神经网络得到主题特征向量。最后,利用融合门机制融合文本语义向量和主题向量。实验表明该方法能有效融合主题特征和语义特征,大幅提升了现有社会情绪分类的性能,同时也证明了依存句法感知的递归神经网络在语义编码上的优越性。(2)提出一种基于端到端的主题增强自注意力网络的社会情绪分类方法:该方法首次解决了在社会情绪分类任务上主题学习与情绪分类学习的分离问题,设计了一种统一的神经网络框架以多任务学习的方式联合训练主题建模和情绪分类两个任务。具体地,我们提出了一种神经主题模型进行主题特征学习,还提出了一种主题增强的自注意力机制融合语义特征和主题特征。实验表明这种端到端的联合训练网络不仅能显著提升社会情绪分类性能,对主题建模也具有明显的积极作用。同时在鲁棒性和训练效率上该方法也有很好的表现。(3)提出一种基于语义驱动主题编码器的社会情绪分类方法:该方法首次在主题编码中融合细粒度的单词级别语义特征。我们提出了一种语义驱动的主题编码器来合成每个主题的嵌入向量表示,并基于主题嵌入向量和文档主题概率分布得到文档主题特征向量;也提出了一种前向自注意力网络利用单词顺序信息,进行文本语义特征的学习。实验表明我们提出的语义驱动主题编码器超越了传统的基于概率的主题编码器,能有效提升社会情绪分类性能。同时在鲁棒性和训练效率上该方法也有很好的表现。本文从以上三个方面对现有社会情绪分类技术做出改进,并使其性能得到大幅度的有效提升,为后续社会情绪分类领域的工作提供了重要的借鉴参考意义。在将来,我们还可以从情绪间先验关系、事件建模、大规模语言模型、超长文本建模等角度进行进一步的创新研究和性能提升。
其他文献
“十四五”规划从宏观层面强调了创新研发的重要性,对全社会研发投入的各项指标提出了具体要求。创业板公司中占有较大权益份额的股东为维护自身利益,其决策行为很可能会影响研发投入和市场绩效。基于此,以2015—2019年创业板公司作为研究对象,使用回归分析和中介效应检验等方法,实证检验股权集中度、研发投入与市场绩效的内在联系,并重点关注研发投入的中介作用。研究发现:在其他条件不变的情况下,股权集中度抑制了
随着我国经济的转型,人口红利的逐渐消失,未来建筑行业发展装配式建筑早已是大势所趋。根据国内装配式混凝土剪力墙结构的不同类型,分析了大板结构、空心剪力墙结构、内浇外挂剪力墙结构、双面叠合剪力墙结构的结构概念、结构设计难点以及其优缺点。空心模剪力墙结构体系和叠合剪力墙体系在保证装配式混凝土结构安全的同时,具有施工简单、低成本、适合大规模生产的特点,因此建议优先推广使用。
随着智能制造的发展,基于卷积神经网络(CNN)的故障诊断方法成为了研究热点。学习率作为深度学习最重要的超参数之一,对CNN模型的最终性能有很大影响。传统的学习率调整方法耗时费力,且过度依赖于专家的经验。现有的学习率优化算法由于具有固定的变化规律,难以保证其在不同数据集之间的泛化性能。本文提出一种新的基于深度强化学习(DRL)的学习率调度器,用于处理故障诊断问题的CNN模型,并在工程案例中进行验证。
斗转星移,时代变迁,随卫星制作及发射相关技术的进步,低轨卫星(Low-Earth-Orbit Satellite,LEO)通信网络正在改变传统卫星行业以及移动通信领域的市场格局。囿于传统卫星通信网络架构限制,卫星仅作为信息中转站对任务进行中继转发,存在较大的传输时延,不能有效满足高实时性任务的低时延需求。为应对海量物联时代的众多挑战,LEO通信网络正在被期待提供更丰富的功能。因此,LEO通信网络新
近年来,信息技术在人们日常生活中的普及和渗透使得“人人拥有IT”,因而催生了信息系统个人化的趋势,即用户可以根据自己个性化的需求和偏好,对多个不同的信息系统进行挑选、整合和运用。但现有的关于用户多信息系统使用的理论和研究还相对空白。已有的信息系统使用研究大多还是从单一视角去理解用户对某一个信息系统的使用(如采纳、持续使用、使用方式和使用结果等),而这对于理解信息系统个人化背景下的用户行为是远远不够
固体氧化物燃料电池(SOFC)是一种高效的能量转换装置,能够将燃料气体中的化学能通过电化学反应直接转换为电能。对于Ni-YSZ阳极支撑型SOFC,多孔阳极的微观结构特征导致燃料气体在扩散过程中会出现较大的浓差极化现象,从而引发SOFC的电化学性能衰减。已有研究表明,可通过调控阳极厚度与孔隙的方式减小浓差极化,但这也将对SOFC的力学和电化学性能产生影响。影响主要体现在两方面:一、单电池串联形成的电
乳腺癌是女性群体中最常见的恶性肿瘤类型,每年新增病例数与死亡病例数均排在第一位。乳腺癌干细胞是存在于乳腺肿瘤组织中具有维持自我更新和分化的亚细胞群,是导致乳腺癌患者对化疗耐受、复发与远端转移的最主要原因。信号诱导的增殖相关蛋白1(signal-induced proliferation-associated protein 1,SIPA1),是小G蛋白家族成员之一,在细胞中除了发挥催化活性Rap1
首先整体简要介绍了ISO 15704、ISO 19439和ISO 19440三项国际标准的基本情况,然后对这三项国际标准的核心内容进行了阐述,在此基础上梳理了三项国际标准之间的关系。
制造执行系统(Manufacturing Execution System,MES)是智能车间的重要功能,通过MES可以实现工艺信息的从设计过程到制造过程的传递。然而,输入MES的工艺信息是非结构化的文档,这给自动化的信息识别带来困难。因此工艺信息的自动识别是将MES中的非结构化数据转变为结构化数据的关键。基于深度学习的命名实体识别方法在结构化信息提取中表现出极大的潜力。但是,真实工业场景中工艺文
近年来,计算机视觉的高速发展主要得益于人工标记的大量数据以及图像处理器制作工艺的逐步提升。作为基础的计算机视觉任务之一,图像分割具有重大的研究意义以及实际应用价值(如可用于自动驾驶、医疗影像分析、智慧农业、机器人导航等任务中)。图像分割是一个比较宽泛的概念,按输出结果的不同具体可分为以下四个子任务:无语义的一般图像分割、像素级别的语义分割、只考虑可数类的实例分割以及实例分割和语义分割相结合的全景分