基于知识图谱的自然语言问答技术

来源 :少年科普报(科教论坛) | 被引量 : 0次 | 上传用户:ytcxw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:社區问答已成为现代人分享和获取知识不可或缺的途径。它允许用户提出问题,由有经验的用户热情地回答。通过记录用户操作日志,积累了大量有价值和复杂的数据。 然而,问者必须等待(通常是很长一段时间)直到其他专家用户在社交平台上回答他们的问题。这将严重影响用户体验。在本文中,我们提出了一种基于知识图的社区答案生成方法,用于自动生成自然语言答案。首先,我们提取帖子的核心短语来表示它们的语义关系。然后,我们根据用户的操作记录对用户的知识背景进行建模。 最后,我们在基于用户背景和问题语义的知识图中查询知识实体,然后将它们转换为自然语言答案。
  中图分类号:G4文献标识码:A文章编号:(2021)-04-409
  导言
  如今,社区问答已经成为人们获取知识的一种必不可少的方式。 人们倾向于用自然语言提问和得到答案,而不是输入关键字来获得网页列表。流行的问答平台,包括百度知道和知乎,允许用户提交他们的问题,然后其他用户会热情地回答问题。 询问者可以从许多帖子中标记接受的答案,或者继续评论细节。问答系统提供了一种非常方便的获取知识的方法。
  知识图谱积累了大量的人类已知知识,因此它们是答案的来源。这些方法解析用户的帖子(答案和问题)以获得核心意图,然后查询相关的知识实体作为答案。 然而,以往的大多数研究都是基于词和分裂短语语义提取意图,从而导致问题理解的偏差。 例如,如果短语“知识图谱”出现在一个句子中,他们将使用“知识”和“图谱”来训练相关答案的模型。 但是,专业形式(知识 实体或查询子图)的答案很难被最终用户直接接受。
  总结前人的研究,我们将问答系统分为两类:选择现有答案或生成新答案。我们的工作重点是答案的生成,以防没有相关的答案,或者答案不匹配。由于社区问题不仅取决于字面表达,而且取决于提问者的背景,因此生成标准答案是一项复杂而具有挑战性的任务。在没有类似问题或相关答案的情况下,基于知识的方法给我们指明了一个有希望的方向。
  1.相关工作
  1.1.自然语言的产生
  一些现有质量评估的答案来自用户以前提交的帖子或相关文本或者其他结构化数据]。 它导致用户无法直接从返回的答案中获得知识。我们的研究重点是生成用户问题的自然语言答案。最相关的研究是自然语言生成。许多前人已经将不同的结构化数据转换为自然语言,提出自动生成文本问题和多项选择答案的方法。短语信息被用来生成产品的自然语言摘要。通过建立基于指定类别特性的类别文本生成模型。基于表生成自然语言句子的神经生成模型使用混合对抗性网络生成文本,将知识图中的三元组转换为自然语言文本。 这些研究为我们关于答案生成的研究奠定了坚实的基础。
  1.2.问题答案评价
  在问题答案中另一个问题是答案评估。 前人提出了一些答案问题匹配的评价方法。其中一种视觉问答系统的评价方法,给出了一组用于评估基于知识的QA系统的答案示例。无约束推理问题的评价方法,在QA评估过程中,不仅关注单个问题,而且关注它们的逻辑关系。更常用的答案评价方法来源于其他NLP任务,如机器翻译。 BLEU最初用于评估机器翻译的性能,它依赖于生成文本和参考文本之间的单词覆盖。 ROUGE通常用于文本摘要的评估,它依赖于生成的摘要与人类创建的理想文本之间的单词序列重叠比率,它们已被用于许问答系统使用。但它们忽略了语义单元的完整性,这限制了问题答案的性能。
  1.3.短语挖掘和短语嵌入
  大多数QA方法都是基于单词的,这限制了对问题的理解。文本的语义是基于短语的]。考虑了短语挖掘中短语质量的评价。通过单词嵌入的组合将短语映射到一个连续的向量空间,为短语在其他NLP任务中的应用奠定了坚实的基础。分析短语组合对短语嵌入的影响, 比较不同文本表示对文本分类的影响。 该方法已经被证明可以改善多个NLP任务。结合短语和主题表示,使用短语来改进多语种问题检索,使用短语来可以改善主题一致性问题,同时短语可以提高机器翻译的性能。基于短语表示问题语义, 一些研究人员尝试使用短语来促进QA的性能。
  1.4.数据集和知识图
  我们的实验是基于问答数据集和典型的知识图。 前者提供真实的问答对来训练模型和评估生成的答案。在本文中,我们使用短语来补充实体关系,因此我们提取短语并分别计算不同数据集中的短语数量。短语的数量大约与帖子的数量成正比,因此堆栈溢出的短语最多。知识图谱是一个广泛的知识库,它以三元组存储了大量的实体和关系。比较算法基于两个知识图生成候选答案。
  综上所述,我们提出了使用短语来表示问题语义,并基于知识图生成自然语言答案。 首先,我们通过解析树提取帖子的核心短语,并通过共现频率学习短语之间的相似性。然后,通过对过去帖子的语义分析,对用户的背景进行建模。 最后,我们通过用户背景和问题语义查询知识图中的相关实体,然后将匹配的实体转换为自然语言答案。为了评估生成的答案,我们使用短语覆盖来从语义的角度来评估文本的相似性。 总之,使用短语来表示后语义和用户知识,有效地提高了答案生成的性能。
  参考文献
  [1] 魏玉良.互联网人物摘要知识图谱构建方法研究[D].哈尔滨:哈尔滨工业大学,2019.
  [2] 徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606.
  [3] 黄恒琪,于娟,廖晓,席运江.知识图谱研究综述[J].计算机系统应用,2019,28(6):1-12.
  [4] 漆桂林,高桓,吴天星.知识图谱研究进展[J].情报工程,2017,3(1):4-25.
  [5] 孙镇,王惠临.命名实体识别研究进展综述[J].现代图书情报技术,2010(6):42-47.
  [6] X. Cheng, S. Zhu, S. Su, G. Chen, A multi-objective optimization approach for question routing in community question answering services, IEEE Trans.Knowl. Data Eng. 29 (2017) 1779–1792, https://doi.org/10.1109/TKDE.2017.2696008.
其他文献
摘要:随着时代快速更迭,小学教育不仅仅只是知识的传授,更注重于小学生的素质教育。而语文由于表现形式和内容较为丰富是小学生综合能力的体现。语文教学除了听、说、读、写之外,更需要的是陶冶小学生的情操,和提高他们的文化素养,也要重点培养小学生情感、审美等方面,促进他们全面发展。作为语文小学教师要积极引导小学生感受美,发现美,使学生在美的环境下更好的接受教育。  关键词:小学生;语文教学;审美教育  中图
期刊
摘要:随着我国教育水平的不断发展,人们越来越重视小学生语文语文能力的培养,只是因为通过培养小学生的语文阅读能力不仅能够提高小学生对于复杂文章的理解能力,更是能够在潜移默化中影响小学生的语文写作能力,由此看来,家长和学校需要重视对小学生语文阅读能力的过程。经过调查发现,小学生在进行阅读文本细读的过程中,能够大大提升其阅读能力,因此很多学校都为小学生开设了专门的阅读教学文本细读课程,虽然在这个过程中取
期刊
摘要:数学知识的锻炼和引导需要一个不断积累的过程,小学数学高效课堂的构建目的是希望学生在各类知识的掌握上取得更好的效果。但是,高效课堂必须以小学生为主,教师的多年教学经验面对每一届学生都要做出科学的转变,应观察小学生的学习特点、学习能力、学习成绩,在课堂的教导方式上不断创新,吸引小学生从被动学习转变为主动学习。  关键词:新课改背景;小学数学课堂;创新模式  中图分类号:G4文献标识码:A文章编号
期刊
摘要:二次函数部分知识是初中数学的重要组成部分,也是中考数学的热门考点,对学生以后的数学学习具有重要的基础作用《义务教育数学课程标准(。2011年版)》明确提出,学生通过二次函数的学习能够体会二次函数的生活意义,能够观察二次函数的图像和理解二次函数的性质,并且能够实现二次函数与一元二次方程的转化,完成求解。函数部分知识较为抽象,介于初等数学和高等数学之间,学生理解起来难度较大,成为了很多学生初中数
期刊
摘要:思维导图又叫心智导图,是学生表达发散性思维的一种实用性工具。思维导图主要运用图文并重的方法,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接,充分运用左右脑的机能,用于记忆、阅读。初中名著阅读中,随着名著阅读的分值在语文试卷中占有非常重要的地位,提高学生的名著阅读能力显得越来越重要。由于初中生对于名著阅读能力差,针对这种情况,本文就探讨如何利用思维导图
期刊
摘要:在以人为本的思想不断提升的今天,小学生的安全教育问题变得越来越重要,是学校和家庭需重点关注的问题。在这种情况下,抓好安全教育,通过安全教育提高学生的安全教育意识和自我保护能力显得至关重要。  关键词:小学校园;安全教育;优化措施  中图分类号:G4文献标识码:A文章编号:(2021)-04-410  引言  作为一名小学教育工作者,笔者深知小学安全教育的重要性。在实际生活中,由于社会的复杂性
期刊
摘要:教育环节中产生大量的多源异构数据,数据分析系统已在教学和科研活动得到广泛应用。 但如何有效、科学地利用这些数据进行教师评价,成为高校绩效体系中的一个重要课题。 然而,由于缺乏统一的表示和评估过程,使用多源和多模态数据对教职员工进行全面评估仍然是一个挑战。为此,本文提出了一种新的基于知识图谱技术的大学教师评价系统。  中图分类号:G4文献标识码:A文章编号:(2021)-04-408  导言 
期刊
摘要:新课程改革背景下,我国的教育目标逐渐发生转变,核心素养成为素质教育的指向。为顺应这一变革,教师应用发展的、与时俱进的眼光看待高中思想政治教育,抛弃传统的课堂教学方式,提高学生的能力水平,培养学生的学科核心素养。  关键词:核心素养;高中思政  中图分类号:G4 文献标识码:A  高中思想政治作为学校进行德育的主要课程之一,其教学品质对学生的政治觉悟以及综合素质起关键性的作用,想要为国家培
期刊
摘要:神经网络作为一种重要的机器学习算法,基本上是模仿人脑进行 感知和认知。 在自然语言处理领域得到了广泛的应用,并取得 了显著的效果。 神经网络具有很强的捕捉特征的能力。它可以通过 非线性变换将输入数据的特征分布从原始空间转化为另一个特征空 间,并自动学习特征表示。 因此,它适合于抽象任务,如知识推 理。在这里,我们回顾了神经网络和知识图谱的基本概念和定义,以及对利用神经网络技术构建知识图谱进行
期刊
摘要:在我国素质教育快速发展的背景下,小学科学课的教学内容不再是只注重学生的基础知识传授这样简单需求了,而是要求科学教学老师在日常的教学过程中要注重培养学生的科学精神以及科学活动中的探究品质。对于科学老师来说培养核心素养就是培养小学生的个人素养,因此小学科学教学老师必须要运用自身所学的科学知识和能力来培养和提升学生的综合能力。小学科学的教学老师也应该与时代一起进步改善自身的教学方式,探索和研究培养
期刊