基于知识图谱的文本自动生成研究

被引量 : 0次 | 上传用户:shuangsssss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动生成旨在根据已有信息生成可读的文字表述,在智能问答系统,新闻的自动撰写与发布,学术论文撰写等场景中有广泛应用。为了更好的表示信息之间联系,现有很多文本自动生成方法利用知识图谱实现文本生成过程。然而,现有图谱到文本生成方法仍存在以下问题:(1)没有挖掘图谱中节点之间的隐藏联系,导致捕获图谱信息不完整;(2)在模型训练过程中没有对生成文本进行准确评估和指导模型训练,导致生成文本存在信息偏差;(3)生成文本只进行一次推理过程,没有迭代优化,导致生成序列粗糙。首先,针对上述问题(1),本文提出一个基于知识图谱推理的文本生成模型。具体地,本文将知识图谱推理问题建模成一个分类问题,首先扩展图注意力机制以捕获给定节点的多跳邻域中的节点和关系特征,然后通过一个分类器预测节点之间是否存在联系,从而推理并补全知识图谱。最后,基于原始知识图谱及补全图谱关系,进而生成流畅的文本。实验表明,本文所提方法能挖掘知识图谱中节点之间的隐藏联系,进而补全知识图谱信息,有效提升文本生成模型在AGENDA数据集和M-AGENDA数据集上的性能表现,在Hits@1指标上高于Paperrobot方法25分。其次,针对上述问题(2),本文提出一个面向多角度评估的文本生成模型。具体地,首先用层级联编码的方式全面考虑图谱的全局信息和局部结构信息生成文本段落,并从文本质量、文本真假性和是否和知识图谱相匹配三个角度评估生成的文本并指导模型训练,进而生成与知识图谱信息相符合的文本。实验表明,本文提出的方法能对生成文本进行准确评估和指导模型训练,并提升在AGENDA数据集和Web NLG数据集上的性能表现,在BLEU指标上高于目前最先进方法CGE-LW方法1.59分。最后,针对上述问题(3),本文提出一个基于迭代优化的文本生成模型,模型具有一个编码器和两个解码器,第一个解码器用于解码生成粗糙序列,第二个解码器用于打磨和优化粗糙序列。实验表明,本文提出的方法能有效迭代优化生成文本,第二个解码器能推敲并优化第一个解码器生成的文本,提出的模型在WebNLG数据集上有优良的表现,在BLEU@3指标上第二个解码器高于第一个解码器2.7分。
其他文献
随着互联网技术的迭代更新,越来越多的数据被存储于云服务器和个人终端设备上,不论是图片、视频、音频或是文本数据都是非结构化的,因此它们不能很好的被计算机识别或使用。知识图谱以结构化的形式保存数据,让计算机可以有效地应用这些数据,目前知识图谱在搜索引擎、问答系统、知识推理等领域已经成为了不可或缺的技术。但是知识图谱的构建与维护是一个漫长的工作,需要相关领域内的专家们不断地完善。因此知识图谱补全成为该领
学位
目的:概述了电梯维保及其质量评价领域的研究历程与研究热点,并对未来的研究发展方向进行预测与展望。方法:使用文献计量分析法,首先综述了电梯维保领域的研究现状,从发展趋势、出版刊物、热点词分布等方向进行分析,梳理电梯维保领域发展历程,并归纳总结电梯维保领域的研究热点。其次,从电梯维保质量评价的定义与对象出发,对电梯维保质量评价领域的指标与评价方法进行分析。最后,系统总结电梯维保质量评价研究现状与面临的
期刊
以稀土熔盐电解渣为原料,提出了磁选—焙烧—浸出工艺提取稀土元素。全过程工艺考察结果表明,原料在100 mT的最佳磁场强度条件下,除铁率达到45.59%,非磁性相在焙烧浸出过程的最佳工艺条件为:焙烧温度750℃、CaO添加量30%、浸出温度25℃、盐酸浓度3 mol/L,全过程工艺的Nd、Pr的总回收率分别达到95.98%、96.15%。采用原位XRD表征结合热力学分析,明晰了焙烧过程矿相转化规律,
期刊
知识图谱是一种结构化的知识存储方式,高质量的知识图谱能够为许多人工智能任务赋能,例如智能问答,推荐系统等。然而,由于现实世界的知识的规模非常庞大并且在不断增长,现有的知识图谱往往是不完整的且非常稀疏的。因此,如何设计知识图谱自动补全的算法成为当下的研究热点。知识图谱补全目前存在以下挑战:1、知识图谱中的关系存在复杂的逻辑语义,造成了补全实体间的链接存在挑战性;2、知识图谱中的许多实体的类型同样需要
学位
推荐系统作为一种帮助用户缓解信息过载问题的主要手段,其性能往往由推荐的有效性、可解释性和多样性等多个方面共同决定。结合知识图谱与图神经网络从而提升推荐性能已成为当前研究热点。尽管目前最先进的结合知识图谱和图神经网络的推荐模型KGCN的推荐性能已经达到了不错的效果,但是尚未对用户端进行建模,限制了推荐有效性的进一步提升,并且没有充分利用知识图谱中节点之间的高阶连通性,导致推荐结果的可解释性较差。因此
学位
随着新一代人工智能的提出与高速发展,认知智能成为了当前研究的热点,知识图谱作为知识的容器,为智能应用提供了知识组织管理与应用支撑服务,成为认知智能发展的核心。知识图谱描述包含若干客观事实的真实世界,但由于其构建过程的局限性(大部分由手工构建或半自动化构建),存在大量缺失知识,许多隐含知识没有被发现。因此,利用知识图谱补全技术发现隐含链接,补全缺失知识,具有重要意义。知识图谱补全指基于图谱中已存在的
学位
先天性腓骨缺如(Congenital Absence of Fibula)是一种罕见的先天性长骨缺如性疾病,目前为止该疾病发病机制尚不明确,现多认为其发病原因是由于基因突变或染色体缺失等导致,从逻辑推理,该疾病为先天性疾病,多认为其缺如的形成应起源于胚胎发育时期(即孕4-6周),临床上主要表现为肢体短缩、马蹄足畸形、随着机体逐渐发育可能出现胫骨弯曲,踝关节缺如则可能会出现足内翻或外翻畸形,甚至由于
期刊
为提升电梯维保企业无纸化办公程度,开发了一个“电梯维保抽查”微信小程序客户端,介绍了微信小程序的前端开发流程,应用input、button、radio、picker等标准控件,编写了相应的软件代码,方便了电梯维保企业维保抽查工作的记录和汇总。
期刊
收集、整理归类稀土冶炼中萃取槽搅拌系统容易出现的7种故障,针对搅拌系统常见故障,在萃取槽搅拌系统的结构形式、制造工艺查找故障原因,从选材、结构设计、安装要求等方面提出改进泵轮式搅拌系统的方案,并取得良好的应用效果。
期刊
为研究钢板加固后陶粒混凝土梁的抗弯性能,对1片未加固的对比梁和3片厚度分别为0.5 mm、1.0 mm、1.5 mm的钢板粘贴加固梁进行抗弯试验。试验结果表明:与未加固陶粒混凝土梁对比,适筋条件下粘钢加固陶粒混凝土梁的开裂荷载、极限荷载最多分别能提高91.3%、39.5%;加固梁与未加固梁的破坏机理与破坏形态相同;钢筋与钢板的应变发展规律基本一致,钢筋与钢板协同作用效果较好,且钢筋应变表现出一定的
期刊