基于结构特征和多层信息交互的文本语义匹配关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hjy276756267
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本语义匹配是自然语言处理中一个基础且重要的研究方向,其目的是判断两段文本是否符合给定的语义关系,其包含了大量的下游任务,如自然语言推理、复述识别、答案句选择等等。任务不同,文本语义匹配所需判断的语义关系也不一致。然而无论哪一种语义关系,判断文本间语义是否匹配都需要研究:(1)如何表示文本语义?(2)如何判断文本间语义关系?针对这两个核心研究点,研究者们将文本语义匹配研究分为基于表示和基于交互的文本语义匹配研究。前者主要研究如何设计更好的文本编码器来表示文本,而后者则更注重于研究判断文本间语义关系的方法。本文将利用文本结构特征对基于表示的文本语义匹配展开研究,并利用多层交互匹配过程中产生的历史信息对基于交互的文本语义匹配进行探索。此外,针对非纯文本格式的异构文档(如PDF、网页、扫描文档等等),现有自然语言处理应用如开放域问答系统通常需要预先根据不同的文档格式设计不同的内容抽取算法,再从中抽取文本内容进行后续的分析处理。这无疑需要消耗大量的人力物力,而且损失了原始文档中有价值的布局和视觉信息。为此,本文从视觉角度通过文档图像描述异构文档,对文本和文档图像间的跨模态文本语义匹配及其在问答领域的应用展开研究。具体来说,本文的主要研究内容包括以下四个方面:1.基于文本线性结构表示的文本语义匹配研究。在基于表示的文本语义匹配研究中,现有研究通常会用自注意力网络取代卷积神经网络和循环神经网络来构建表示能力和可并行化能力更强的文本编码器。然而,由于自注意力机制的位置独立性,自注意力网络难以利用文本的位置结构特征去捕获文本内的语义依赖。本文分析了文本线性结构,利用词的绝对位置、词间相对距离和词序三种结构特征对其描述。在此基础上,本文提出基于双向线性位置感知的Transformer,通过绝对位置可感的相对位置编码和双向掩码策略将上述三种结构特征有机地融合在一起,共同建模文本线性结构,并利用文本线性结构更精准地建模文本顺序、文本内的关键信息以及局部语义依赖信息。在自然语言推理和复述识别两个文本语义匹配任务上的实验验证了该方法的有效性。2.基于文本混合结构表示的文本语义匹配研究。文本结构特征多种多样,不同结构特征间相辅相成,仅从单一角度无法全面地建模文本结构。为了同时从不同角度建模文本结构,本文利用多头注意力机制的多视角建模优势,提出了多掩码式多头注意力机制,并在此基础上提出了混合结构特征引导的Transformer,将词序、词相对距离和词依存距离同时引入到Transformer中。在多种结构特征的帮助下,该模型可以同时建模文本的线性结构和语义依存结构,更好地捕获文本内局部和非局部语义依赖。在自然语言推理和复述识别中的实验结果表明,该方法与只利用文本线性结构的基于双向线性位置感知的Transformer模型相比有了进一步的提升。3.基于多层网络交互历史的文本语义匹配研究。在基于交互的文本语义匹配研究中,现有研究通常会利用多层交互匹配更好地判断文本间的语义关系。在此过程中,前序匹配产生的历史表示信息和历史交互信息都会对后序匹配起到指引的作用。然而现有研究往往只能传递并利用其中一种信息,无法很好地利用所有的历史信息。为了更好地传递并利用这两类历史信息,本文提出了全信息传递网络。该网络使用一种新颖的原始-平均混合链接模式更高效地传递表示信息,并使用基于记忆的注意力机制利用全局交互矩阵保存并传递交互信息。在自然语言推理和复述识别中的实验结果表明,在资源受限的情况下该方法要优于其他非预训练模型和同等规模的预训练模型。4.基于布局结构的跨模态文本语义匹配研究。针对广泛存在的非纯文本格式异构文档,本文从文本语义匹配研究延伸到面向文本和文档图像间的跨模态文本语义匹配研究。在文本语义匹配被广泛应用的开放域问答中,现有系统需要针对不同格式的异构文档设计特定的内容抽取算法预先抽取文本内容作为其信息来源。这不仅大幅度增加了可规模化开放域问答系统的构建成本,而且损失了原始文档中的布局和视觉信息。为此,本文提出开放域文档视觉问答任务,以异构文档的文档图像集合为信息源回答用户提问。同时,本文融合前面所有的研究内容对面向文本和文档图像间的跨模态文本语义匹配展开研究,提出了联合布局结构及文本线性结构的全信息传递网络,并将其应用于开放域文档视觉问答任务中的精排阶段,对问题和检索返回的候选文档图像进行匹配。在本文提出的首个中文开放域文档视觉问答数据集上的实验验证了模型的有效性。
其他文献
赋予机器理解人类语言的能力是人工智能的重要目标,机器阅读理解(Ma-chine Reading Comprehension)是以此为目 标的代表性自 然语言处理任务之一,旨在教会机器阅读自然语言文本并回答相关问题,机器需要具备一定的语言理解能力才能给出正确答案。近年来机器阅读理解受到学术界和产业界的共同关注,取得了令人瞩目的研究进展,技术成果也已融入真实业务系统。数据在这个过程中起到了关键作用,大
学位
运动物体非线性扰动两相界面广泛存在于医药学、仿生学和流动力学领域。该问题中不仅涉及物体与界面周围流体之间的相互影响,而且常伴着较为复杂的流动现象,例如向上运动的物体粒子穿越两相界面后液桥夹断和液膜包裹。运动物体出水后,尾部引起的液柱、液体飞溅和破碎等现象。因此本文对运动物体非线性扰动两相界面的问题进行数值研究,拟为自然界中该类流动现象给予合理的解释,并指导相关实验设计和工程应用。首先,基于动量守恒
学位
随着航空发动机逐步向高性能化的发展,其内部涡轮部件所承受的气动热载荷也随之提高,涡轮动叶的间隙泄漏流动对气动损失的影响也愈加强烈。因此相应的间隙泄漏流动控制方法也应运产生,主要包括叶顶凹槽、叶顶小翼和叶顶修型等被动控制方法。对于叶顶凹槽,其通过凹腔内部的旋涡结构可以显著地降低间隙泄漏流量,但会引起较大的掺混损失。对于叶顶修型,其产生的叶顶形状较为复杂不规则且造型方法也多种多样,没有明显的规律可循。
学位
波形端面动压型机械密封是核主泵的关键基础部件,起到防止高温、高压、具有辐射性流体泄漏的目的,其相关技术和产品受到国外的垄断。为了掌握波形端面动压型机械密封的设计和制造技术,论文开展了核主泵波形端面动压型机械密封的设计与开发。以波形端面动压机械密封为研究对象,考虑液膜的空化效应,建立密封理论模型,研究了在恒定和非恒定液膜厚度条件下运行工况参数对密封性能的影响规律,揭示了波形端面密封的运行机理。考虑密
学位
环境污染是人类共同关切的重大问题,面向工业源开发污染物的治理工艺及资源化利用方法,是符合我国可持续发展战略需求的关键举措。无论是污染物的吸附还是催化转化,其科学本质均为典型的气-固异相反应,多孔材料(如活性炭、分子筛)在其中扮演吸附剂或催化剂的角色。污染物的高效吸附和转化为多孔材料孔隙、骨架和表面官能团的精准构筑提出了更高需求。基于上述研究背景,本文探究了典型污染物分子(SO2、NO和苯系VOCs
学位
熊式一改编译介的话剧《王宝川》在欧洲风靡一时,对我国现有的跨文化戏剧改编有着重大借鉴意义。目前学界主要对熊式一的文本翻译进行了深入研究,但忽视了熊式一改编的话剧《王宝川》与原有的京剧版本相比,不论从形式上还是内容上都产生了巨大差异。话剧版本有效地进行了跨文化传播改编,这为目前跨文化改编戏剧作品提供了宝贵经验。
期刊
半球谐振陀螺(Hemispherical Resonator Gyroscope,HRG)是一种高精度的哥氏振动陀螺,是21世纪最理想的惯性传感器之一。由于HRG具有长寿命、高精度、高可靠性、可小型化、低功耗、轻质量、组成结构简单以及能够适应各类空间物理环境等优点,已在航天、航空、航海以及陆地等各个领域的惯性导航系统中得到了应用。因此,为了进一步提高力反馈HRG的精度和性能,研究HRG的误差机理、
学位
新一代信息技术与互联网的飞速发展,使各应用领域的服务业务不断跨网跨域跨界交叉融合,进而形成了复杂的大服务生态系统。随着人工智能、认知计算与深度学习技术的迅速发展与应用,服务向智能服务发展。智能服务的核心是自动辨识顾客显性和隐性需求,并主动、高效、安全地提供满足顾客需求的服务。在大服务生态与智能服务场景下,为了实现随时随地获取用户需求并交付服务,软服务机器人的研究逐步引起研究者的关注。准确、完整的获
学位
强化学习是机器学习的重要分支,是实现通用人工智能的重要手段。与其他机器学习方法的不同之处在于,强化学习是一个主动学习的过程。智能体通过与环境交互来获得经验,通过最大化奖励来学习值函数和策略。强化学习的核心问题是如何提升智能体对环境的探索效率。在有限状态空间中,探索方法使用状态计数和值函数置信区间的估计来获得高概率近似正确的理论保证,然而这些方法并不能直接应用于高维状态空间的深度强化学习任务中。在高
学位
无线传感器节点能够从物理世界中采集温度、湿度、图片等数据,并将这些数据以一跳或多跳的方式传到服务器(也叫汇聚节点或sink节点)上。无线传感器网络在实时监测、异常检测、目标追踪等方面具有广泛的发展和应用前景。传统的无线传感器节点依靠电池供电,而电池电量十分有限,需要频繁地更换电池。但是,传感器网络常常被部署在森林、大型设备内部、污水过滤系统等恶劣的环境中,这使得频繁的电池更换是非常困难甚至是不现实
学位