基于上下文实体特征融合的实体关系图自动生成方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:awind54335
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件需求分析过程中,数据库设计领域的实体关系图能够直观地展示需求描述的实体属性与关系,有利于系统数据库建模和分析。然而,人工设计与绘制实体关系图存在耗时长、效率低的缺点。因此,实现从数据库需求文本生成实体关系图的自动化流程,具有重要的研究意义和应用价值。现有的需求文本生成实体关系图方法存在两个问题:一是缺少合理的分类方法来筛选出与图元素相关的关键内容语句,而无关语句可能会引入误差内容;二是现有研究方法通过启发式规则识别图元素,依赖分词和词性标注结果,因而存在规则限制和误差传递的问题,且其生成结果的规范性依赖人工检验。本文研究工作包括:(1)提出一种基于上下文实体特征融合的文本分类方法。需求文档中只有部分语句与实体关系图生成相关,本文对实体关系图元素的需求文本映射关系进行建模,通过数据增强提升模型训练效果,并将上下文实体特征融合输入序列中进行需求文本分类,从而提高实体关系图自动生成的准确性。本文使用数据库书籍和网络公开的需求文档数据集进行对比实验。实验结果表明,使用该方法进行需求文档文本分类后,实体关系图自动生成结果的准确率平均提高了4.9%。(2)提出一种基于句法分析和本体推理的实体关系图元素提取方法。针对现有实体关系图生成研究中存在规则限制这一问题,本文将实体关系图元素识别任务建模为实体关系三元组识别问题,使用深度学习模型识别实体和属性元素,结合句法分析进行关系抽取,替代现有研究中使用启发式规则提取图元素的方法。此外,本研究在实体关系图自动生成过程中引入本体推理技术,设计了基于实体关系图元素本体的规则推理方法,对识别的图元素及其结构进行问题检验和纠正。在相同需求文本上的实验结果显示,本文提出的图元素提取方法在精确率和召回率指标上的表现优于最新的实体关系图生成方法。基于上述研究,本文实现了一种实体关系图自动生成工具。需求分析人员可以利用该工具快速自动生成实体关系图,并结合业务理解对生成结果进行调整,从而提高设计效率,节约时间成本。本文通过实际的企业需求文档展示该工具的应用效果,证明了该工具对数据库需求分析有一定的应用价值。
其他文献
各类含氮废水中,含较低氮浓度尾水的高效低碳脱氮一直是水处理领域的重点和难点。厌氧氨氧化(ANAMMOX)作为一种低碳低能耗的新型生物脱氮技术,受到了大量学者的研究和关注。本研究围绕在低氮浓度尾水的ANAMMOX处理中脱氮效率低、稳定性差、环境抗性差以及实际废水存在有机物干扰等问题,采用两级升流式厌氧生物膜反应器,考察两级ANAMMOX工艺处理低氮浓度尾水实现深度脱氮的可行性,分别研究了Fe2+、有
学位
知识图谱是一种高效的知识表达模型,是由节点和边构成的网状结构,是一种描述客观世界的数据结构。与传统的信息管理方式相比,知识图谱能够帮助人们更快速有效地获取所需知识间的逻辑关系,有利于知识间智能推理的实现,对于许多下游应用至关重要。电子元器件是电子元件和小型的机器、仪器的组成部分,本身常由若干零件构成,包含多种封装和性能等属性参数,其知识结构复杂,知识广泛且量大,潜在的关联知识难以被挖掘。针对电子元
学位
当原子分子中的束缚电子在高强度的近红外激光辐照下时,它们会以驱动激光频率的整数倍频率向外发射高频辐射,发射的光脉冲可以到达电磁波谱的极紫外和软X射线区域。由于发射的频率很高并且限制在驱动场频率的整数倍,这个过程被称为高次谐波的产生。在给定单色线性极化驱动场的情况下,P.B.Corkum等人提出了该过程公认的半经典模型,又被称为“三步模型”,它将高次谐波的发射分为三个主要过程:电离、加速和复合,并给
学位
飞秒强激光与原子分子的相互作用是当前研究的前沿和热点之一。当激光电场强度可与原子内部库仑场相比拟时,产生了很多新奇的非线性物理过程,里德堡态激发作为新的强场物理过程受到了广泛关注。与之前的粒子探测相比,光谱测量的方法可以分辨量子态以及其产率随时间演化,对强激光场中里德堡态激发的产生机制的理解是一个很好的补充。强激光场中原子分子的辐射特性有助于深入认识飞秒激光等离子体的形成和性质,具有重要的研究意义
学位
卷积神经网络在图像识别领域取得了巨大的成功,但其训练过程通常需要海量的带标注样本。然而,收集大量标注样本的成本十分昂贵,尤其是在稀有物种识别或医疗影像诊断等场景中。因此,小样本图像分类已成为深度学习发展中十分重要的研究课题。为了缓解标注样本不足导致的模型过拟合现象,现有方法大部分利用结构简单的人工卷积神经网络来提取图像特征。然而,这些网络只包含标准卷积操作,参数量多,模型复杂度高,特征表达能力不足
学位
随着居民消费升级和生活品质的提高,服务机器人产业规模快速增长。迎宾机器人作为服务机器人的分支,是未来吸引实体流量的重要入口。现阶段的迎宾机器人存在几个问题:迎宾机器人任务编辑的用户配置流程耗时长;迎宾机器人任务执行仅将用户视为动态障碍物而使带路效果不好,其引导模式难以满足各类场景的需求。针对上述问题,本文设计并实现了一款操作方便、智能化程度高的迎宾机器人任务编辑和执行系统,分为编辑器模块和执行器模
学位
随着光电子成像技术更为深入的发展和应用,超短激光脉冲诱导分子电离过程中所运用的光电子速度成像技术已然成为分析电离机制、物理过程涉及的量子态、分子结构和超快动力学的良好途径。通过对光电子成像图中提取的光电子动能分布以及光电子角分布的研究,可以获得分子轨道、结构和动力学等方面的详细信息。本篇论文主要研究部分为以下两个方面:在第一部分,主要利用波长为800 nm、脉宽为50 fs的单色激光与氨分子相互作
学位
近几十年来,随着超强和超短激光脉冲的发展,激光技术已成为国际技术竞争的主要前沿之一。强场物理也已成为近年来的热门话题。人们利用激光与物质相互作用,进而在原子分子的自然阿秒时间尺度和亚纳米空间尺度研究电子动力学。最近,一些理论研究表明,阿秒脉冲能够有效地诱导原子分子中的超快磁场。这种光诱导的磁场为分子和分子磁学的许多研究提供了可能。本文系统地研究了He+离子、双原子分子H2+和N2、三原子分子H32
学位
分子转子是分子机器中的重要一类,这类分子中某特定片段无能垒转动引起的奇异物理特性使其受到了广泛关注。由于硼原子缺电子特性导致了高度离域成键模式的硼团簇,这为分子转子提供了良好的电子结构。2010年,具有双重芳香性平面B–19团簇中内核(B6)相对于外部硼环的无能垒转动被理论研究中发现,并命名为分子马达。随后,一系列平面纯硼团簇(B+13,B20-/2-,B182-,B-40,B-11,B+15)被
学位
近年来,大型室内场所安全一般使用人力巡逻或安装摄像头。但人力昂贵且人员素质不一,全覆盖安装摄像头价格高,因此成本低且效果好的安防机器人逐渐成为主流选择。安防机器人巡逻决策包括地图处理、巡逻路线规划、巡逻策略选择和巡逻过程监控。目前市场上现有的安防机器人巡逻决策系统大多存在两种问题:一是采取固定巡逻路线,缺乏区域侧重点,且路线难做到全覆盖;二是巡逻策略比较单一,无法满足人们对安全更高的需求。为了解决
学位