融合知识图谱的多编码器神经网络中文问题产生方法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:haohade
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能在各个领域的广泛应用,研究如何将人工智能应用于教育领域逐渐成为关注的焦点。智能提问是人工智能应用于教育领域的一个体现,是构建智能化教学环境的一个重要组成部分。智能提问是一门交叉学科的研究方向,涉及的领域包括自然语言处理、教育学、计算机科学、认知科学等,其主要目的是根据文本内容自动产生自然语言问题。智能提问也称问题产生。传统的问题产生方法是基于规则或模板的问题产生方法,该方法依赖人工根据文本内容制定出问题产生规则或模板。然而,规则或模板容易被过度设计,导致这种方法产生的问题质量不高,难以满足现实需求。近年来,深度学习在自然语言处理领域得到了广泛使用,特别是在机器翻译、智能问答等方向上取得了重大进展,展示出了潜在的应用价值。因此,研究员开始尝试利用深度学习技术实现问题产生。目前,研究提出的基于神经网络的问题产生方法主要关注英文问题产生,针对中文问题产生的研究相对较少。因此,本文主要针对现有的基于神经网络的问题产生方法存在的不足,重点研究基于神经网络的中文问题产生方法,并取得了如下研究成果:1、融合知识图谱的神经网络问题产生方法当前研究提出的基于神经网络的问题产生方法主要利用神经网络模型从原文本中产生出问题。这种方法存在的不足是:当输入的文本内容较多时,将增大模型的训练难度,导致模型产生的问题质量较差。此外,由于缺少领域知识,与人工产生的问题相比,利用神经网络模型从原文本中产生出的问题质量不高。针对上述情况,本文以WebQA数据集为例,提出了一种将原文本进行简化、从知识图谱中引入与答案相关的先验知识,并利用神经网络模型实现中文问题产生的方法。在WebQA数据集中,每条样例由原文、问题和答案组成,其中问题是根据原文产生的,答案是原文中的一个单词或短语。首先,本文参考相关文献,制定出原文简化规则,然后根据规则将原文进行简化处理,从而降低模型的训练难度。接着,本文将答案作为关键词,从知识图谱中引入与答案相关的先验知识,以弥补简化原文过程中被过滤掉的与答案相关的上下文信息。同时,知识图谱的引入也为模型产生更复杂、更深层次的问题带来了可能性。此后,本文使用简化的原文、知识图谱三元组对WebQA数据集进行扩展,构建出融合知识图谱的WebQA数据集。该数据集的创建可以弥补目前严重缺少中文问题产生数据集的情况。实验结果表明,本文提出的方法能够有效降低模型的训练难度,提高模型产生问题的质量。2、基于多编码器的神经网络问题产生方法当前研究提出的基于神经网络的问题产生方法难以根据文本中指定的关键词或短语提出问题(即指定的关键词或短语是问题的答案),并且问题中会出现疑问词与答案不匹配的情况(即模型产生出错误的疑问词)。针对上述情况,本文提出了一种基于多编码器的神经网络问题产生模型。该模型使用多个编码器对不同类型的文本进行编码,并单独使用一个编码器对答案(即指定的关键词或短语)进行编码,其目的是准确地表达每一种数据信息;当解码器在产生问题时,将注意力分布于每一个编码器中的文本之上,其目的包含两个方面:一是提高解码器在产生问题时,分布在答案上的注意力,从而促进解码器根据答案提出问题,二是利用注意力机制将不同类型的文本进行有效融合。本文使用该模型在融合知识图谱的WebQA数据集和结构化数据集KBQG上进行了实验。实验结果表明,基于多编码器的神经网络问题产生模型在两个数据集上均能根据指定的关键词或短语提出流畅的问题,并且该模型提高了问题中疑问词的准确率。最后,本文研究了基于词向量嵌入的文本输入表示和基于BERT的文本输入表示对基于多编码器的神经网络问题产生模型性能的影响。实验结果表明,使用基于BERT的文本输入表示能进一步提高该模型产生问题的质量。
其他文献
借鉴医用激光源的保障模式提出了基于计量检定人员、工程技术人员、操作使用人员的对科研设备的全程质量计量保障体系的三级模式。该模式的顺刺实施,将标志着我院针对实验设备
随着我国建筑业转向高质量发展阶段,工程质量的地位和重要性日益显著。建设工程质量关系群众利益和投资效益,也是建筑业可持续健康发展的关键。目前,建设工程在实施阶段的质量问题仍然存在,这主要与三方责任主体的质量行为有关。施工单位的规范施工程度、建设单位和监理单位的监管力度决定了工程质量控制水平,而实际工程中不规范施工、监管不力等问题时有发生,导致工程质量控制水平低下,工程质量监管的效率和效果不容乐观。组
[目的]了解福建省消毒产品生产企业执行《消毒产品生产企业卫生规范》的情况,及其消毒行业的基本状况。[方法]采用卫生部卫生监督中心编制的《消毒产品生产企业现场调查表》进
主要介绍尝试一种新的方法对心电信号的QT间期进行检测.QT间期指心电波形中QRS波起点到T波终点这一段所对应的时间间隔,代表心室去极化过程.QT间期及其变异对于预测恶性心率