基于门控图神经网络的跨文档多跳推理问答方法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:enjoy12_east
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答(Question Answering,QA)是自然语言理解中具有挑战性的任务,近年来备受研究人员关注。目前大多数关于问答的研究都是根据单个文档甚至单个段落来回答问题,即问题的答案往往来源于单个文档或者单个句子,也称之为单跳推理问答。多跳推理问答相对单跳推理问答来说是一个更具有挑战性的任务,它要求模型能够对多个文档和问题之间的关系有深入的理解,即需要模型从文本的不同部分收集信息来回答问题。这就会使一些模型在单跳推理问答任务中表现突出,但在多跳推理任务中却表现不佳。如何提高模型处理复杂问题的能力,使其能够有更强的推理能力是当前亟待解决的问题。本文针对跨文档多跳推理问答任务提出了一个基于门控图神经网络的多跳推理模型,该模型在图卷积层结合了注意力机制和门控机制,使其具有处理复杂问题的能力。具体来说,我们把该任务转换为一个图上的推理问题,候选答案实体的提及是图的节点,其中边编码不同节点之间的关系。我们根据以下原则连接这些节点:(1)如果它们共同出现在同一个文档中(我们将其称为DOC-BASED edges);(2)如果一对命名实体的提及是相同的(我们将其称为MATCH edges——这可能连接文档内的节点或者文档间的节点)。除此之外,为了防止出现不连通图的情况,我们对不能用以上两条原则添边的任意两个节点之间添加了第三种类型的关系(Completment edges),从而构建了一个连通图。对图中的补边(Completment edges)我们使用了余弦相似度对节点之间关系强度进行了区分,同时在图中加入自环边(Self-loop edges),确保在信息传递的过程中节点携带自身的信息,使图中节点的语义信息更精确。然后将图卷积网络(GCN)应用到构建的图上,对图中的节点信息进行更新。在每一层图卷积操作中,我们在候选答案和问题之间使用了注意力机制,对问题的表示进行更新。此外,受人类推理行为的启发,在图卷积网络中加入与问题相关的门控机制,在推理过程中加入问题信息,让其具有更强大的推理能力。最后为了验证模型的性能,本文在公开的多跳问答数据集WikiHop以及MedHop上进行了实验,并和目前多跳推理问答任务中的一些主流模型进行了比较,实验结果证明了本文提出的模型在多跳推理问答任务上的有效性和适用性。
其他文献
约20%的人在其一生中都会患有癌症,其中乳腺癌的发病率逐年提高并在新发患者数量和死亡数量上都位居第一。据统计结果显示,45岁到55岁是乳腺癌病症的高发期,早期乳腺癌的治愈率可达到90%,所以越早发现越能提高乳腺癌患者的治愈率。由于传统的乳腺检测方式时间周期长、费用高,所以提高检测速度并降低费用变得越加重要,拉曼光谱作为一种分子散射光谱,能够检测到物质中分子结构和含量的变化,在疾病诊断方面具有一定的
学位
随着科技的不断发展,以物联网、云计算等技术为支撑的大规模开放在线课程正逐渐成为一种大众喜爱的学习方式。在线课程摆脱了传统课堂的时空约束,对学习者的资质限制较少,具有自由、灵活的优势,但是其也面临着管理难以规范化、辍学率高、通过率低等问题。为了提高课程的完成度,研究人员通常基于平台中学习者的历史学习行为数据,采用机器学习模型预测学习者发生辍学的可能性。机器学习模型强大的建模能力,能够实现对学习者学习
学位
人类拥有精确跟随他人视线的能力,这种追随他人视线的能力被称为凝视识别,这种能力可以让人们更好地理解他人的意图,甚至可以预测他们未来的行动。计算机一旦掌握这种能力,就能在多个领域(教育、医疗、智能监控、VR游戏或人机交互领域)为人类提供更方便、更智能的服务。近年来,随着深度学习的不断发展,凝视识别这一基础研究取得了一系列的突破,这无疑推动了计算机视觉的进步。虽然目前大多数凝视识别算法取得了令人印象深
学位
目标检测任务是计算机领域中的一个重要研究分支,涉及的应用领域也十分广泛,例如,医疗影像、智能交通安全等。以智能交通安全领域为例,通过在街道各个角落安装高清摄像头,实时获取街道行驶车辆的交通轨迹,以便及时提醒驾驶人遵守交通规则,避免车祸的发生。目标检测技术已成为生活实际场景中的重要工具。目前,基于深度学习的YOLO目标检测算法系列中,YOLOv4算法在单个GPU上就可完成训练,而且使目标检测的速度和
学位
随着科学技术和共享经济的不断发展,短期租赁服务网站越来越多。Airbnb作为著名的短期租房平台,已经成为了很多年轻人出门旅游住宿的首选。对于租房销量来说,价格因素不可忽视,但是不同于传统酒店业成熟的定价体系,Airbnb平台上租房的定价是由房东自主决定。房东需要为租房制定合适的价格来吸引更多的房客,而房客也需要了解租房合理的价格以防上当受骗,所以租房价格是一个值得研究的问题。早期对于租房价格的研究
学位
随着消费电子产品日新月异的发展以及社会对公共安全的迫切需求,摄像头网络已经从提供静态监视的早期角色,演变为当前的能够获取大量视频信息以进行智能处理的复杂网络系统,而且功能也不再是简单的监控用途,可以为后续的研究提供资源基础,例如目标识别、目标跟踪、姿态估计等。由于摄像头网络的规模逐渐庞大,需要覆盖的区域也更加复杂,如何降低摄像头网络的组网成本及如何提升目标空间的覆盖率已成为迫切需要解决的问题。因为
学位
跨膜蛋白是存在于生物膜上的一类特殊蛋白质,承担生物膜两侧物质和信息的传导功能,在多种重要的生命过程中发挥至关重要的作用,如物质运输、离子通道、能量传递、信号识别等。由于它们的特异性结构,目前药物市场上约一半以上药物靶点是跨膜蛋白,其结构和功能研究对药物研发具有巨大价值。然而相对于水溶蛋白,生物技术手段难以大规模测定跨膜蛋白结构,虽然近年来样本数量持续增长,但仍然远不能满足相关研究的需要。因此,采用
学位
在所有生命活动中,金属离子借助“结合作用”通过跨膜蛋白形成的离子通道,从而调节多种生物分子的表达和激活,参与细胞信号转导,完成各种基本生物功能。由于跨膜蛋白具备其自身独特的结构和功能特性,正确识别金属离子与跨膜蛋白结合位点,对于蛋白质工程、离子运输机制以及药物设计的阐明都具有重要意义。然而,当前缺乏大规模测定跨膜蛋白离子结合作用的生物实验技术,亟待有效的计算工具为相关研究及应用提供支撑。已有的金属
学位
近年来,随着互联网技术的发展,层出不穷的在线考试平台逐渐进入智能教育领域中。与传统的教育考试方式相比,在线考试平台有着时间上更灵活、空间上更自由的特点,不仅提高了学生的学习效率,同时也减轻了教师在教学过程中批改大量试卷的负担。然而,由于教育智能在线考试系统是从庞大的题库中随机抽取题目进行组卷,这种情况使得学生在平时练习测试的过程中存在灵活性低下、无法针对每个学生的实际掌握情况进行出题等问题和挑战。
学位
大气压冷等离子体作为一种适用于生物治疗的技术,在医学上有着丰富而广泛的应用,包括医疗器械灭菌、口腔、肿瘤及皮肤疾病等领域。大气压冷等离子体的应用有直接和间接两种形式,二者相辅相成。大气压冷等离子体是一种很有前途的皮肤病治疗技术,但仍需要进一步的探索和研究。我们总结了大气压冷等离子体在皮肤科中的直接和间接应用并展望,为等离子体医学的发展方向提供参考。
期刊