面向三元组描述文本生成的图编解码器算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:liuji19840718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三元组到文本生成旨在将知识图谱三元组映射到描述其信息的文本,在普遍使用知识图谱作为信息数据存储的大数据时代下,三元组到文本生成技术不仅可以助力互联网数据分析以提高产能和效率,并且对于自然语言中的结构化与非结构化数据转换研究发展具有重要的实际意义。从知识图谱生成文本是一项基本任务,任务的完成度取决于生成句子的质量以及对信息描述的准确性,以前的研究大多采用标准的序列到序列方法,这不可避免地无法捕获图结构信息。虽然已有学者针对这一问题制定了一些方法规则,但却不具备良好的领域通用性。同时,在神经网络中如何提高编码解码的准确性,以提高生成句子的忠实度和流畅性,仍然是在该任务中亟待解决的关键问题。针对以上问题,本文对图卷积神经网络展开了研究并融合了自然生成领域相关算法,在这些基础上做出了改进,提出了两种解决方案,同时在自构建的数据集上进行了实验验证。本文的主要研究内容如下:1)针对如何提高模型编码图信息的问题,本文研究将卷积神经网络作为模型的编码器来替代一般的线性化编码器,以保留输入图本身的结构信息,同时提出一种图增强规划算法(GEP),该算法将输入三元组中的每个关系以及单词嵌入为一个新节点以增强图信息,并且降低了模型嵌入以及特征提取的难度。2)在图卷积神经网络编码器的研究中,本文提出一种特征融合算法,通过串行的方式保留了全局结点编码与局部结点编码这两种编码计算方式的信息和优势。同时本文研究将图卷积神经网络进行多层堆叠以获取更深层的特征表达,通过加入紧密连接的方式保证模型在训练过程中的梯度稳定和隐藏状态信息传递。3)在针对如何获取更高质量的生成文本问题中,本文对解码器进行多种算法集成改进,将上下文门集成到LSTM网络中,以在隐藏状态更新过程中保留上下文信息,从而确保忠实于原始含义。同时,本文在解码器中添加了复制注意力和惩罚机制,以解决词汇表外(OOV)问题并提高生成句子的质量。本文在英文数据集Web NLG以及自构建的中文海洋产业数据集上对模型进行了性能验证。大量实验表明,本文提出的模型方法可以有效地从图结构输入中生成高质量的文本,并在四个自动指标中获得高分,同时在消融实验中也证明了本文所提出的算法的有效性,能够有效地提升三元组到文本生成任务的性能。
其他文献
船舶工业是现代综合性产业,是国家制造业体系中的重要支柱。船舶管件制造具有典型的多品种、变批量、混线生产、工艺复杂等特点,所涉及的加工流程复杂,生产变动因素多,生产节点要求苛刻,给管件的加工带来了很大的困难。现阶段管件加工车间信息化水平较低、多数依靠人为经验的生产管理模式,已无法满足节能减排、节约成本、提高效率的要求,成为车间生产制造的瓶颈。所以,要突破船舶管件制造现状,就需要针对工艺设计、生产过程
学位
近年来,随着我国汽车消费市场的繁荣,汽车厂家、金融机构对以汽车作为载体的消费金融业务愈发重视。随着汽车销售市场竞争的愈发白热化,终端经销商通过零售获取的利润越来越低,甚至不惜亏损销售。恶劣的竞争环境迫使汽车经销商利用车辆零售之外的衍生业务,增加整体利润空间。其中,汽车金融业务作为衍生业务的突破口,不断推出更具竞争力的金融产品,首付一降再降、贷款资料一减再减、审批速度更能实现秒批。若客户选择分期购车
学位
随着经济的发展和汽车的普及,城市或者城郊的交通环境变得更为复杂。而非机动车出行作为日常交通出行的交通工具的补充方式之一,在短距离出行扮演重要角色。中国事故统计数据显示,在近年来在中国交通领域中,与非机动车相关的事故发生率持续上升,中国超过一半的交通事故与非机动车有关。由于非机动车体积小,速度快,其行驶路径容易被其他车辆或者其他事物所阻挡,在行驶的过程中无法及时对非机动车横穿马路的行为进行反应。因此
学位
工业数字时代下产生了大量的数据,如何将数据转化为有价值的知识是值得研究的问题。作为智能制造中的关键技术,工业机器人在整个自动化生产过程中起着重要的影响作用。由于工业机器人的系统结构越来越复杂,一旦发生故障,可能会影响整个生产周期,准确地对工业机器人进行故障诊断,使其处于最佳的工作状态至关重要。随着知识图谱的发展,将有经验有价值的数据转化为知识分析越来越被重视,因此提出了构建工业机器人故障诊断知识图
学位
随着近几年制造业的突飞猛进,玻璃生产业对玻璃的精度要求也越来越高,尤其是应用于精密仪器所生产的玻璃面板。玻璃面板的缺陷检测,在工业生产上处于尤为重要的地位。由于手机玻璃面板本身具有易反光、表面光滑和精巧等特性,目前关于手机玻璃面板缺陷的数据非常稀缺,如果人为制造缺陷不仅会比较困难,还导致材料的浪费,加大了生产成本。另一方面,手机玻璃面板缺陷数据在采集过程中需要到独特的打光方式以及高清的工业相机,更
学位
科技进步日新月异,伴随而来的是国内外各种机器人技术的快速发展,无人机技术发展也瞬息万变起来。无人机技术囊括了诸多理论知识以及工程知识,是一种多学科交叉融合的先进技术,在全世界无人机科研人员的不懈研究下,从飞控底层驱动优化,到控制律改进等等,无不为提升无人机性能提供了良好的基础。与载人飞行器相比,无人机具有体积小、造价低、使用方便、不需要长时间培养操作人员的特点,这些优势使得无人机广泛应用于航拍、电
学位
图像描述子是一种非常常用的表示图像特征信息的方法,其被广泛运用于图像分类、三维重建、稀疏匹配、稠密匹配等热门的机器视觉任务上,是目前机器视觉领域里面的一个研究热点。描述子最重要的两个特性是不变性与可区分性,目前基于深度学习的描述子算法虽然在很多任务上都超越了传统人工设计的描述子算法,但其尺度不变性的表达比较弱,不容易区分不同分辨率的图像。因此本文立足于解决深度学习方法的尺度不变性问题,借鉴其他任务
学位
由于嵌入式系统的特点,嵌入式设备的软硬件往往是按需设计,无法预留满足各种功能的接口。这导致了嵌入式设备在切换工作场景时,其软硬件往往需要重新设计,以满足用户的个性化需求。同时,在通过分析某工程客户“机器人+视觉”的应用,发现该应用需具备多种功能,在项目的应用过程中,往往需要根据跟用场景的不同而频繁调正控制器的软硬件。为了有效解决上述问题,本文针对该工程客户“机器人+视觉”的应用,设计了一个可组态的
学位
牙科树脂以其良好的物理化学性能及容易操作等特点,成功取代了传统的银汞合金成为了目前牙齿修复的首选材料。但树脂修复体的平均寿命仍较大程度落后于银汞合金,其主要原因即材料本身力学性能不足导致的修复体断裂,以及树脂聚合收缩或热膨胀系数不匹配导致的边缘裂隙和二次龋齿等。因此,为了解牙科树脂固化动力学特征,相继诞生了一系列固化监测方法,如差示扫描量热法、动态热机分析法、介电分析法等。但这些方法大多为接触式方
学位
如今,电子商务与人们的日常生活密切相关。电子商务平台提供评论区供用户在线评论,评论数据会长期保存在电商平台上。这些评论对于消费者来说,直接影响到是否选择该商品;对于商家来说,可以了解用户对商品的评价,并及时改进不足。但各个电商平台上的评论区积累的评价内容十分庞大,直接阅读评论十分费力,难以获取有效的信息,不仅降低用户阅读评论的效率,也使得商家难以获取用户反馈的信息,增加改进商品的难度。因此如何在如
学位