双关语识别与生成关键技术研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zhengziwei5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双关语是一种用来描述和理解词义歧义的修辞表达,主要通过词的多重含义或者同音近音的方式,从而使得双关语在上下文语境中具有双重含义,其语言表达更为含蓄、幽默。双关语不但是一种语言学的修辞现象,也是一种隐式情感表达方式,具有独特的研究风格,给人们留下深刻的印象。近年来,随着互联网及其技术的不断发展,微博、推特、论坛等社交媒体平台成为全球最大规模的公共数据源,而双关语文本出现在更加多元化的社交媒体平台上,得到了大多数研究学者更为广泛的关注。因此,研究学者们迫切需要利用自然语言处理技术深入理解和加工双关语信息。双关语研究旨在赋予计算机像人类一样分析双关语的能力,是一项富有挑战的研究课题。
  针对目前国内外双关语研究中语义信息利用不足、外部资源利用不充分等问题,本文深入研究双关语的语言学现象和表达特点,展开双关语识别研究、双关词定位研究和双关语生成研究,具体完成的工作主要如下:
  (1)对于双关语识别任务,双关语从类别上分为语义双关语和谐音双关语,对两类双关语分别进行识别。首先针对语义双关语识别方法存在由于词的一词多义性引起的语义理解不充分问题,提出了一种基于上下文表示和门控注意力机制的语义双关语识别方法。该方法深入挖掘语义双关语的歧义性,通过引入不同的语言环境中使用上下文语义表示来解决语义双关的一词多义性。另一方面,针对谐音双关语识别方法存在由于词的同音引起的语义表示不丰富问题,提出一种融合发音和拼写的注意力机制谐音双关语识别方法。该方法深入挖掘谐音双关语的语言特性,通过构建发音语义表示和拼写语义表示来捕获谐音双关语的歧义信息。实验表明,上述的双关语识别方法能够有效利用语义信息提升双关语识别的性能。
  (2)对于双关词定位任务,针对语义双关词定位方法存在忽视了语义双关语的语言学和语用学信息,提出了一种基于多维语义关系和语义相似度匹配的语义双关词定位方法。该方法根据相关的语言学理论,引入低维分布语义空间和外部语义资源提供的同义词信息。另一方面,针对谐音双关词定位方法存在忽视了谐音双关语的语言学和语用学信息,提出了一种基于细粒度语义表示和BiGRU-CRF的谐音双关词定位方法。该方法深入挖掘谐音双关词在双关语中的表达方式,构建融合字符、音素、词性、位置、词等级别的细粒度语义表示,利用新的标签策略和命名实体框架定位谐音双关词。实验表明,上述的双关词定位方法均获得了比目前先进的方法更好的结果。
  (3)对于双关语生成任务,针对生成的语义双关语缺乏歧义性和流畅性从而引起生成文本的质量不佳问题,提出了一种基于歧义性和流畅性的语义双关语生成方法。该方法引入生成对抗网络,由生成器和判别器组成,前者由层次ON-LSTM注意力机制构成,后者通过语义双关词及其不同的词义作为输入判断是真实文本还是生成文本,并结合层次的奖励机制和强化学习机制训练生成器。另一方面,针对生成的谐音双关语存在缺乏上下文语境信息从而引起生成文本的质量不佳问题,提出了一种基于语境理解和语义修正的谐音双关语生成方法。该方法包含语境理解模块和语义修正模块两个部分,前者包括局部语境理解和全局语境理解,后者首先通过预训练模型作为生成器生成谐音双关语,然后利用谐音双关语分类器获得激励得分,通过强化学习机制优化生成的谐音双关语。实验表明,上述提出的生成方法能够生成高质量的语义双关语和谐音双关语。
其他文献
微结构光纤,由于其结构设计的灵活多变性及传统光纤无法比拟的优异光学特性,极大地突破了传统光纤的局限,为纤维光学带来了一场深刻变革,为光纤技术及其应用领域的发展提供了新的发展途径。近年来,微结构光纤及应用研究成为国内外关注的热点,为光通信、光传感、光器件、量子光学、生物医学等领域的发展瓶颈问题突破提供了新的契机。微结构光纤中存在的空气孔为功能材料的修饰提供了天然的通道,材料修饰的微结构光纤集材料的优
高速移动网络作为“泛在”移动互联网的重要组成部分,受到了广泛的关注。随着网络技术发展,高速移动网络可以融合多个电信运营商提供的网络,为移动用户提供丰富的网络信息服务。然而,传统的高速移动网络因其自身架构的局限性和复杂的无线链路特点,难以灵活地协同异构网络来满足移动信息服务的多维需求,造成服务质量差、用户体验不佳和资源利用率低等弊端。因此,本文在智慧标识网络理论基础下,结合高速移动网络特点与服务多维
光纤光栅是最常见的光学器件之一,基于光纤光栅的光电子器件具有体积小、易集成和易与光纤通信系统相连接等优点,是光网络的重要基础。啁啾相移光纤光栅(PS-CFBG)通过在啁啾光纤光栅(CFBG)上引入相移,使其频谱内打开一个或多个极窄的“窗口”,在多通道窄带滤波方面具有明显优势,能够广泛应用于波分复用、多波长调制以及多参量传感等领域。本论文采用V-I传输矩阵法深入分析了PS-CFBG的频谱特性,并以此
LTE(Long Term Evolution)作为下一代移动通信技术的长期演进,具有传送速率高、时延低、可靠性高、载波带宽可灵活配置等特点。然而高速铁路电磁环境复杂,电气化列车运行时弓网离线放电现象频发,其主要频谱能量范围可达几百MHz,是干扰铁路移动通信系统正常工作的主要骚扰源。此外,根据我国现有的频谱资源分布,需要考虑LTE-R在400MHz范围内的适用性,因此有必要研究分析弓网离线辐射骚扰
学位
双目立体视觉是计算机视觉与图像处理等研究领域的一项重点任务,旨在通过计算左右目视点图像中像素点的视差,进而恢复其场景深度,包含了图像中丰富的几何结构信息。因此,研究双目立体视觉的关键是从立体图像对中提取精准、稠密的视差图,继而为更高级的视觉任务提供可靠的先验信息。21世纪以来,随着计算机硬、软件水平的快速发展,双目立体匹配计算技术已被广泛应用于增强现实、自动驾驶、无人机导航制导与控制、三维重建以及
近年来,小型无人直升机及其相关技术得到了快速发展,被应用于军事和民用的许多领域。小型无人直升机具有可垂直起降,机动性高,续航时间长等特点,但是其内外部结构较为复杂,整体呈现静不稳定性,状态参数之间存在强耦合,系统高度非线性,这些因素都给小型无人直升机飞行控制系统的设计带来了较大的挑战,也制约了小型无人直升机更进一步的广泛应用。本文基于小型无人直升机的飞行动力学结构特性给出了其非线性和线性模型,对于
近年来,随着人工智能技术进入发展的黄金时期,移动机器人领域也迎来了新的发展机遇。作为机器人领域的核心部分,基于SLAM的室内自主导航技术受到国内外学者的广泛关注。本研究以机器人的室内自主导航技术为研究背景,分别对SLAM技术,机器人自定位及路径规划三个部分进行理论的研究,在此基础上利用实验验证导航系统各模块的有效性,并结合ROS的分布式网络完成实际的应用。  首先,详细介绍了移动机器人硬件配置,并
输出调节问题是自动控制领域中的核心问题之一,其包括了系统的镇定、抑制外部的干扰和跟踪参考信号等控制问题。它的研究目标是设计反馈控制器使得系统能够抑制外部的干扰和跟踪参考输入,并且闭环系统的信号是最终一致有界的。然而在大多数文献中,其研究内容中大部分的系统控制方向都是已知的,显然只有较少的系统能满足这个条件,这就限制了其在实际问题中的应用。  本文首先研究具有未知控制方向的不确定非线性系统的自适应输
CNN pruning is a well-known process that is highly recommended in the optimization of neural network performance such as reducing computational costs of neural networks.Nowadays, pruning approaches fo
软件缺陷报告的严重性分析在软件维护过程中起到关键作用。随着软件规模的不断增大,越来越多的软件公司使用Bugzilla和Jira等缺陷跟踪系统管理软件缺陷。这些系统利用缺陷报告记录软件缺陷,并通过分析缺陷报告的严重程度实现软件维护资源的合理分配,降低软件维护成本。  结合缺陷报告的严重性属性,已有研究主要基于缺陷报告的文本信息,通过分类算法完成缺陷报告严重程度的预测。然而,当前研究主要停留在粗粒度的
学位