【摘 要】
:
伴随着互联网和社交媒体的飞速发展,网络用户正在从单纯的信息获取者转变为信息的生产者。在这一过程中,大量带有个人情感的信息在社交媒体中传播、发酵、聚集、碰撞,形成群体情感并反作用于现实社会。这就使得对社交媒体中的情感信息进行分析、理解和生成的文本情感计算研究正在成为自然语言处理的重要课题。现阶段面向社交媒体的情感分析研究大部分集中在基于文本内容和用户特征建模的分析层面,相对缺乏结合外部知识和因果推理
【基金项目】
:
国家自然科学基金重点项目《社交媒体中文本情感语义计算理论和方法》; 国家自然科学基金面上项目《文本情绪计算框架、模型和方法研究》; 国家自然科学基金培育项目《社会化媒体群体情感的深层理解和预测研究》; 深圳市基础研究与自由探索项目《面向社交媒体的个体/群体情感分析、归因和预测研究》;
论文部分内容阅读
伴随着互联网和社交媒体的飞速发展,网络用户正在从单纯的信息获取者转变为信息的生产者。在这一过程中,大量带有个人情感的信息在社交媒体中传播、发酵、聚集、碰撞,形成群体情感并反作用于现实社会。这就使得对社交媒体中的情感信息进行分析、理解和生成的文本情感计算研究正在成为自然语言处理的重要课题。现阶段面向社交媒体的情感分析研究大部分集中在基于文本内容和用户特征建模的分析层面,相对缺乏结合外部知识和因果推理的立场分析研究。同时,目前的情感文本生成研究主要集中于单一会话场景下的文本生成,缺乏融合用户情感及立场的复杂场景立场对话生成能力。为此,本文提出一整套覆盖文本情感分析、文本立场分析、情感文本生成和立场对话生成的研究框架及相应的研究方法,针对性解决各个问题研究难点的同时,关注不同问题间的共性技术。本文主要工作包括:针对文本情感分析中,神经注意力机制缺少全局感知能力,而多头自注意力机制存在参数过多、运行效率较低的不足,本文借鉴人类阅读认知过程中的“模板注意力”,提出了一种卷积神经注意力计算机制,以提高文本情感分析性能。这一机制应用一维卷积操作模拟人类的注意力信号,通过有限地扩增注意力感受野以增大全局感知范围的同时,只增加了少量模型参数,控制模型的计算代价上升。在此基础上,本文提出一种面向语句级和文档级情感分析的卷积注意力神经网络模型。进而,利用卷积注意力机制的全局情感感知能力,改进了一种连续文本情感表达抽取算法。在语句级和文档级情感分析数据集上的实验结果表明,本文提出的卷积注意力神经网络模型性能明显优于传统情感分析方法。针对文本立场分析需要同时对立场对象和立场表达文本进行表示学习的特点,本文分别提出了一种结合立场对象的卷积注意力模型以提高立场对象的表示学习能力,以及两种融合大规模结构化外部知识的方法以提高立场表达文本的表示学习能力,从而大幅度提高文本立场分析的性能。针对立场对象的语义表示,本文引入立场对象嵌入和对象注意力机制,提出一种结合立场对象的卷积注意力模型,分别从词语和语句层面利用上下文对给定立场对象进行表示学习。针对立场表达文本的语义表示,本文引入大规模结构化外部知识作为文本理解的背景和依据,通过融合外部知识大幅提升立场分析性能。具体的,针对立场表达文本与知识表示的异质性问题,提出一种基于后融合的知识增强神经记忆网络,通过使用不同的建模单元分别表示文本与外部知识,利用文本与知识间的互补属性高效地筛选与立场表达相关的外部知识,从而提升立场分析性能。针对融合策略中外部知识的噪音与稀疏问题,提出一种多视角知识感知网络模型,将知识实体作为建模视角对外部知识进行更高层次的语义表示,并通过视角层面的融合网络与注意力机制减少外部知识中噪音与稀疏的影响。在两个文本立场分析数据集上的实验结果显示,本文提出的结合立场对象的卷积注意力模型取得一定性能提高;两种结合外部知识的立场分析方法则进一步地提升了立场分析性能,达到目前已知最高水平。针对情感对话文本生成通常要求模型同时具有语义表达生成能力和情感表达生成能力的特点,本文提出一种基于自回归变分自编码器和连续情感表达的情感对话文本生成模型。其中基于自回归变分自编码器的生成模型通过在回复序列生成过程的每一步中加入基于变分自编码器的隐变量推理,对全局语义信息进行感知,提高生成回复的流畅性,从而增强了模型的语义表达生成能力。在此基础上,利用模型的自回归特性,向模型引入连续情感表达信息,增强了文本情感表达生成的连贯性。进而,融合卷积注意力机制提取的连续情感表达,将其通过后验推理模型加入情感文本生成过程中,进一步提升生成文本的情感一致性,增强了模型的情感表达生成能力。在情感对话数据集上的实验结果显示,本文提出的模型在相关性、流畅性及多样性的自动评价与人工评测指标上明显优于基线模型;同时相关实验结果显示出生成文本具有良好的情感表达能力。本文在情感对话生成与基于知识的对话生成研究基础上,通过引入立场对象与立场类标,首次定义了立场对话文本生成问题。将这一问题分解为融合外部知识的对话文本生成和融合预设立场的对话文本生成两个子问题,并针对性设计了一种变分插值自编码器模型以提高基于知识的对话生成能力,以及一种结合立场判别器的立场对话文本生成方法。针对融合外部知识的对话文本生成中“知识复述”与“对话交互”间不平衡的问题,通过隐变量变分插值方法显式地建模对话上下文以及外部知识的影响,并平衡二者间关系,大幅提升了生成回复的可读性与知识利用率。针对融合预设立场的对话文本生成问题,本文在基于知识的对话生成模型基础上,设计了立场对象和立场类标的注意力机制,将给定对象与预设立场类标融入文本生成。在这一过程中借鉴生成对抗网络的设计思路,在模型中加入文本立场判别器,对生成回复立场标签进行判别,并使用策略梯度方法将这一监督信号回传至生成模型中,从而有效提升模型的立场表达能力。在大规模立场对话数据集的实验结果显示,本文提出的立场对话生成模型明显优于基线模型,有效提升了生成对话文本的流畅性与立场准确率。
其他文献
分数阶微分方程被广泛用于描述具有记忆和遗传性质的复杂动力学问题。但由于分数阶微分算子的非局部结构,只有极少数简单的分数阶微分方程能够用解析方法求解。这使得分数阶微分方程的数值求解成为紧迫且重要的研究课题。本文将致力于构造Riesz型空间分数阶及分布阶扩散方程的高阶数值方法,并给出这些方法的稳定性和收敛性的理论分析。本文的主要内容包括以下四个部分:构造了线性Riesz型空间分数阶扩散方程的一类在时间
健康的城市生活环境是个人与社会的共同追求,同时也是城市公共开放空间研究中的重点。城市声环境与城市居民的生产生活息息相关,在生理和心理等方面都给人们带来了极大的影响。随着声景领域研究的不断深入,单纯考虑声音的吵闹程度已不足以描述声音中的所有特征。正因如此,声景研究不仅关注负面声源的影响,更多的是研究人在声环境中的感知,进而考虑正面的声音对人体的积极作用。探求声景对人的生理影响是连接声景与健康之间的桥
基于复杂网络的传播模型,其动力学特征得到了专家学者的广泛关注。节点和连边作为复杂网络的基本要素,是构成网络框架的低阶结构单元,为此,本文首先对网络的节点和连边的重要性特征展开研究,得到了可以刻画节点的传播能力与感染能力的重要性指标以及促进网络传播的最优边结构,对根据特定动力学特征重构复杂网络的反问题研究具有重要意义,为网络传播的分析与控制提供重要参考。值得注意的是,在日常的交流与传播中,两两之间的
人类社会面临着淡水资源短缺的严峻问题,脱盐技术已逐渐成为水处理领域获取净水的重要手段之一。传统能源驱动的脱盐技术如热法驱动和膜法驱动的脱盐处理过程中存在着对化石能源的高消耗并且对环境产生污染等缺点。与传统能源相比,太阳能作为一种绿色可持续发展的资源,可以为脱盐水处理技术提供新型的能量来源。本论文基于界面加热技术通过新型光热蒸发体系的构建实现了太阳能直接驱动蒸发脱盐的盐结晶污染问题的解决和蒸发效能的
光学可调控的形状记忆高分子(SMP)材料能在特定的刺激条件下实现对光学性能的响应性调节,在信息传递、生物传感和微光学器件等领域具有重要的应用前景。目前,对此种类型的SMP材料的研究主要集中在两个方面。一种方法是通过调节材料本身具有的响应性化学发光组分来实现对光学性能的控制。另一种方法则是通过改变SMP的微观结构来实现对光学性能的调控。然而,在现有的光学可调控的SMP材料体系中,形状记忆性能和光学性
原子力显微镜(Atomic Force Microscopy,AFM)在各相环境中对不同材料成像时具有的高分辨率、非破坏性、灵活性以及多功能性,使其成为纳米级表征和测量的最流行的科学仪器之一,广泛应用于物理、化学、材料、生物、医学、纳米科学等领域,并服务于半导体、航天、制造、能源等行业。尽管AFM具有广泛的适用性,但传统AFM的高分辨率成像通常需要花费几分钟的时间,严重制约了AFM的成像效率。本文
视觉目标跟踪是计算机视觉领域中一个重要研究方向,在智能监控、人机交互、自动驾驶等领域具有广泛应用价值。仅给定一段视频中任意目标的初始位置和大小,目标跟踪需要在不利用其他先验信息条件下持续估计目标的后续状态。目标形变、遮挡、光照变化、背景干扰等因素对目标跟踪算法的准确性、鲁棒性以及实时性提出了极高要求。在复杂环境下的目标跟踪问题是一个充满理论挑战性和实践挑战性的问题。注意力机制是人类有效过滤信息的方
胰岛素对糖尿病患者血糖浓度的控制具有至关重要的作用。研究表明,胰岛素通过与胰岛素受体或胰岛素样生长因子1受体结合,进而激活受体相应信号通路来调节细胞的新陈代谢。虽然这两个受体在20世纪70年代已经被发现,但关于它们与胰岛素结合的分子机制至今仍未阐明。同时,由于这两个受体都属于单次跨膜蛋白,蛋白自身又存在很大的结构柔性,所以很难从传统角度对它们开展结构生物学方面的研究。因而,本文基于单颗粒冷冻电镜技
氧杂蒽染料由于具有高摩尔消光系数、高荧光量子产率、高光稳定性、相对较长的发射波长和良好的生物相容性等优异的光物理性质,受到了科研工作者广泛关注。但是,传统氧杂蒽染料的吸收波长和发射波长依然位于紫外/可见光范围内(绿色到黄色),且斯托克斯位移(小于30 nm)过于狭窄,使得它们难以直接用于活细胞和活体动物中进行目标分子检测和荧光成像。因此,探索用于开发具有优良光物理性质和大斯托克斯位移的长波长(大于
利用半导体光催化技术,将太阳能转变为氢能是缓解能源危机和环境污染的重要途径。石墨相氮化碳半导体光催化剂由于具有二维的π共轭结构、合适的能带结构、可见光吸收和制备简单等优点,因此其被广泛应用于光催化分解水制氢研究。然而,由富氮前驱体直接焙烧制备的石墨相氮化碳存在着可见光吸收不足、光生电子-空穴对复合严重、电子导电性低和比表面积小等缺点。尤其是光生电子和空穴的快速复合导致了石墨相氮化碳在光催化反应中表