基于知识推理的自然语言数据探索关键技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liucrobin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类社会所积累的数据规模愈发庞大,数据分析和处理的成本和代价不断增加,能否从海量数据中高效地获取知识,成为影响数据分析方法的效率的关键因素之一。数据探索,是指从源数据中获取知识的过程;基于自然语言进行数据探索,能够为数据提供自然语言接口,降低数据分析门槛,提升数据分析的效率。知识推理技术能够挖掘现有知识中潜在的数据语义,对知识库和知识图谱进行补全和完善。本文针对自然语言数据探索任务中元数据不够完整的问题,设计一种复合元数据,并依此设计了一种基于知识推理技术的自然语言数据探索方法。主要工作具体如下:(1)提出了一种新的复合元数据定义,设计了一种新的基于知识推理技术的关系型数据库复合元数据构建方法:基于关系型数据库的模式等多源知识,先定义关系型数据库的简单元数据,然后基于简单元数据构建知识图谱,将简单元数据的图谱汇总构成更完整的知识图谱,然后使用知识推理技术来对知识图谱进行补全,从而充分挖掘知识图谱中丰富的数据语义,将此图谱作为复合元数据。实验结果表明,通过知识推理,使得知识图谱具备了更完善的知识,元数据包含的数据语义更加完善,该方法能够有效解决元数据不够完整的问题。(2)提出了一个基于图计算、特征增强等方法构建的深度学习模型,基于复合元数据完成一种对关系型数据库数据的自然语言数据探索任务:将自然语言翻译成数据库查询语句SQL。模型采用编码器-解码器架构,编码器使用图卷积网络和Transformer模型对知识图谱和自然语言组成的联合输入进行编码;解码器采用抽象语法树作为中间表示,完成自然语言到SQL查询语句的翻译。实验结果表明,该模型能够有效完成自然语言数据探索任务,生成相应的SQL查询语句。(3)基于上述研究工作,设计并实现了一个基于知识推理的自然语言数据探索的软件系统原型,该系统主要包括自然语言数据探索功能、元数据构建与管理功能、数据库即时交互功能、语料管理功能等。
其他文献
作为一种新型分布式基础服务,区块链因其去中心化、防篡改、可追溯等特性,自比特币诞生后持续受到社会各界的关注与研究。区块链技术被誉为是继互联网后的革命性技术,能够打破传统信任体系壁垒,天然地为各方建立信任。时至今日,区块链技术已从最初数字货币的底层技术发展为可以承载各类分布式应用的区块链服务,并在金融、供应链、医疗、教育等众多邻域得到了应用。与此同时,随着区块链技术的发展更迭,区块链系统的安全性正面
学位
目前人工智能的高速发展使得很多方面都有了巨大的突破,自然语言理解的发展,人们更希望人工智能能达到认知智能的水品,而认知智能也一定程度上是衡量智能的标准。逻辑推理能力作为人类的记忆能力、学习能力、判断能力的一种综合反映,也是认知智能亟待解决的难题。本文主要工作是基于自学习的自动解题系统的设计与实现,解题系统的理论基础是置换合一,实现方式是基于规则的产生式系统,主要涉及解题系统和自学习的构建两个模块,
学位
地震是最主要的自然灾害之一,地震作用会造成建筑物破坏及人员伤亡,传统的抗震技术主要通过增大结构构件尺寸和配筋率来提高建筑结构的抗震性能,但越来越多的地震灾害使人们意识到传统抗震技术具有一定局限性,当实际地震动强度超过设计强度后,建筑物在地震作用下会发生严重破坏,因此抗震性能更好的隔震结构逐渐得到应用。楼板隔震结构将楼板通过支座与梁、柱隔离作为TMD子结构,既避免了结构额外附加质量块,又能有效发挥T
学位
能源问题是我国面临的严峻挑战和重大需求,建筑能耗是终端能源消耗的重要组成部分,占社会总能耗的很大一部分。解决建筑能耗问题对我国能源问题至关重要,是实现习总书记提出“二氧化碳排放于2030年前达到峰值,于2060年前实现碳中和”目标的重要途径。可再生能源将逐渐取代化石能源,成为实现人类可持续发展的重要途径。在众多可再生能源中,太阳能是最丰富的,被视为理想的替代能源,可以用来发电、除湿、制热与制冷等,
学位
随着“十四五”规划“双碳”目标临近以及“中国制造2025”规划纲要的提出,电控喷油技术成为汽车领域实现节能减排的重要途径,其中,氧化铝陶瓷因具有熔点高、介电常数小、体积电阻大、耐热冲击性能强的优点,被认为是汽车电控喷油系统中发动机用温度传感器外层理想的耐高温绝缘材料。但氧化铝陶瓷自身硬度高和韧性低的特点使其不能进行传统的变形加工以及机械加工,注射成型工艺因具有可以直接制备各种复杂几何形状和高精度尺
学位
京津冀地区是我国北部沿海富有优势和潜力的经济增长极之一,也是引领我国区域协同、高质量发展的示范区。建筑业是国民经济发展的基础性产业,其发展水平的高低也一定程度上影响着地区的经济发展。建筑业作为资源劳动密集型行业,其在发展过程中消耗大量的劳动、材料和机械设备,这些资源的利用效率将影响区域建筑业的高质量可持续发展。本文从时空双维度对京津冀地区建筑业效率的变化和空间分布特征进行分析,发掘地区建筑业效率提
学位
磁共振成像技术具有安全无创的优点,是临床医学辅助诊断不可或缺的手段之一,被广泛用于获取人体解剖结构和生理功能信息。近年来,MRI技术在成像速度、分辨率方面有了极大提升,但是在采集过程中仍然不可避免地受到噪声的影响。现有MR降噪方法大多单纯基于欠采样噪声,忽略信号采集噪声,本文同时考虑信号采集和欠采样过程中的噪声,构建了MR噪声模拟模型;提出了K空间和图像域并行降噪网络;提出多策略学习的MR图像降噪
学位
目的 观察联合筋膜鞘悬吊术协同提上睑肌缩短术矫正先天性重度上睑下垂的临床疗效。方法回顾性分析自2019年1月至2019年12月于我院收治的40例(56眼)重度上睑下垂患者均采用联合筋膜鞘悬吊术协同提上睑肌缩短术治疗。其中男18例(22眼),女22例(34眼)。年龄5-31岁,平均年龄17.50±4.30 岁。随访6~12个月(平均 8.20±3.50个月)。对术后上睑下垂矫正程度,睑裂闭合情况及
期刊
深度信息对高级场景应用具有重要的意义,比如三维重建、自动驾驶等。获取深度信息的方法包括基于雷达,双目相机,单目相机和RGB相机等,本文研究从单目图像中获取深度信息的方法。目前一些基于卷积神经网络的深度估计方法预测的深度图依然有轮廓不清晰、深度不平滑等缺陷,而且几乎没有提出针对施工现场的深度估计方法。针对这些问题,本论文主要完成了三个任务:一是提出了用于提升特征融合效率的自适应混合注意力机制;二是提
学位
在当今快节奏的生活方式中,无线移动通信已经被应用在我们生活中的方方面面。目前,它不仅局限于电信,还进入了娱乐、安全、商业等领域。移动环境是指由几个计算能力有限的移动节点以及资源有限的强大节点组成的一种不平衡的网络。现在有很多基于移动环境的面向群组的应用程序,如手机的视频会议,移动设备办公等。随着面向群组的应用程序越来越受欢迎,在移动环境中如何保障群体通信中的安全性和避免隐私泄露问题成为了现在急需解
学位