知识图谱语义数据质量评估模型研究

来源 :东北石油大学 | 被引量 : 0次 | 上传用户:lyt7913
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代不断发展,人工智能技术愈发重要,知识图谱是人工智能技术的重要组成部分。知识图谱作为一种全新的知识组织与表示方式,企业和组织对其格外关注,企业和组织将知识图谱作为底层数据的表示和组织方式,充分利用知识图谱的优势,将知识图谱用于问答系统、推荐系统、信息检索系统,石油领域的企业也不例外,利用知识图谱相关技术已经成为当前数字化变革的新方向。但是,当前对于知识图谱的研究主要是在构建和使用这两方面,在这两方面中也会存在不同程度地忽视知识图谱的数据质量的问题。通过对各个领域知识图谱的研究发现,知识图谱在构建过程中会出现语义不准确、语义重复、语义缺失等语义问题,导致构建的知识图谱不符合使用者预期,最终导致使用此知识图谱的应用出现准确性偏差的问题,影响企业和个人的使用。另外,近年来,越来越多的学者在关注数据质量,各种数据质量模型、质量评估工具层出不穷。但是这些工具五花八门、各种各样,数据使用者也不能有效地使用这些质量工具,根本原因在于开发者在开发数据质量模型与工具时都是按照自己的需求开发,没有采用统一的、规范的质量术语体系,未形成一套数据质量评估标准,无法在用户间、社区间进行共享和交换,导致用户在了解数据质量信息过程中感觉数据质量繁琐、数据质量评估结果难懂,进而重新使用新的数据集,从而导致数据集的利用率降低。针对构建和使用知识图谱过程中可能出现的数据质量问题,本文将知识图谱的质量问题与用户的质量需求相结合,将这些需求与传统的数据质量中的维度进行映射,将语义简洁明了的相关需求映射成为语义简洁性维度,将语义完整的相关需求映射成为语义完整性维度,将语义准确的相关需求映射成为语义准确性维度,这样就实现了传统的数据质量向知识图谱语义数据质量的迁移。针对评估工具与评估模型不规范、不统一的问题,本文通过参考W3C这一权威组织提出的DQV本体,然而在DQV本体中并未对具体的评估细节进行描述,因此,本文通过参考《SY/T7005-2014数据质量控制与评估原则》这个石油领域的标准的数据质量评估原则,对DQV评估部分的细节进行扩展,形成一个针对知识图谱语义数据质量评估相关的本体,旨在提升整个评估流程规范化和标准化,以及评估结果的人机可读,提高数据集的利用率。最后,本文以某油田的井下作业知识图谱和OPENKG开源知识图谱为数据基础,通过Python语言,设计实现了一套可扩展的、前后端分离的、拥有规范化流程的知识图谱语义数据质量评估系统。该系统实现了知识图谱语义数据质量评估中语义准确性、语义完整性、语义简洁性这三个最重要、最普遍语义相关维度的评估。在这三个维度的具体评估上,分别采用以异常值检测、错误值检测为基础的语义准确性评估算法,以空缺值检测为基础的语义完整性评估算法,以及以语义相似度为基础的语义简洁性评估算法,通过对上述知识图谱的实验发现,本文所提出的模型是正确的、可用的,并且促进了知识图谱数据质量的发展。
其他文献
在我国能源转型的大背景下,电动汽车将会迎来新的发展动力。同时,伴随着电动汽车智能驾驶技术和大功率快充技术的不断进步,自动化的电动汽车充电模式将成为大势所趋。电动汽车自动充电技术中涉及到的充电接口的插接问题类似于轴孔装配问题,但是电动汽车充电插头和插口较一般的轴孔结构更加复杂,给视觉定位和插接造成了一定困难。此外,为了保证插口使用寿命,充电过程中的接触力不能过大。针对以上问题,本文设计了一个电动汽车
学位
有效保护和合理开发海洋资源成为了多国面向二十一世纪的新目标。为了应对新的世界形势,我国也加快了针对海洋的战略部署来维护海洋权益。对海洋资源信息的采集和处理不仅可以了解生物资源的生长情况,也可以对海底的能源进行探测以及监测输油输气管道或输电线路的运行情况,同时也可以对水雷、潜艇等军事设施进行观测。因此海洋信息的采集和处理对开发利用海洋资源有着至关重要的影响。但目前针对海洋的目标检测领域研究较少且并没
学位
近年来,无人机的发展成为国内外研究的热点,现有构型的无人机包括固定翼无人机,单旋翼直升机和多旋翼无人机。共轴双旋翼无人机属于多旋翼无人机,该无人机的特点在于横向尺寸较小,体积小,适合多平台多空间应用,桨叶共轴反转实现扭矩平衡,机动性强控制简单,使用两个电机提供升力相比四旋翼消耗能量更少,具有较强的续航能力和带负载能力。本文在实验室已有共轴双旋翼无人机的基础上,参考国内外设计方案,对比各种方案的优缺
学位
城市中人员密度大,灾害会造成更大的人员伤亡和财产损失。灾害发生后短时间内开展搜救活动可以大幅提高受灾者的获救概率,但是灾后城市环境复杂,不利于救援工作的展开,为了协助救援人员尽快开展搜救活动,搜救机器人的研发异常迫切。复杂危险的城市灾后环境,对搜救机器人提出更全面的要求。本文以城市灾后搜救任务为背景,以高机动性、越障性能及抗摔落性能为目标,研制了一款更高适应性的轮式搜救机器人,并对其地图构建技术进
学位
随着载人航天技术的日益发展,中国空间站顺利拿到通往太空的通行证,空间站运行期间需要灵活的机械臂配合末端执行器提供在轨维护、在轨装配及性能升级等在轨服务。末端执行器作为在轨服务的关键环节,投入成本巨大,风险系数高,为了确保太空服役时捕获可靠性,地面捕获性能测试是必经阶段。为了地面模拟末端执行器空间捕获过程,检测末端执行器在工作环境中的捕获容差性能,本文基于半物理仿真的方法研制了一套末端执行器捕获容差
学位
根据油气生产过程中的套管损坏影响因素众多、数据复杂等特点,通过数据预处理、随机森林重要性分析等技术对现场数据进行分析与整合,采用特征工程的方法处理缺失值并选取特征参数。针对传统机器学习模型对套损预测不佳的问题,提出基于Stacking思想的集成学习预测模型;该模型采用随机森林、支持向量机、梯度提升决策树和K近邻算法为基模型,逻辑回归为元模型,以此构建泛化能力更强的套损预测模型。结果表明,该模型较于
学位
目的:探讨吞咽口肌生物反馈训练结合吞咽低频电刺激对脑卒中后吞咽困难患者的治疗效果。方法:选取2020年10月1日—2021年10月1日暨南大学附属广州红十字医院昌岗康复二区收治的107例脑卒中后吞咽困难患者作为研究对象,对患者进行吞咽口肌生物反馈训练结合吞咽低频电刺激。比较治疗前后患者洼田饮水试验结果、吞咽功能评分、生活质量评分。结果:治疗后,107例患者治疗后洼田饮水试验结果Ⅲ级占比低于治疗前,
期刊
仿人灵巧手能够模拟人手的抓取操作,是一种通用的末端执行器。目前的灵巧手根据驱动器布置主要可以分为驱动器外置式和驱动器内置式,驱动器外置式灵巧手手部结构轻便,驱动器布置在前臂,通过绳索机构传动,但存在预紧标定困难,维护不便等问题;内置式灵巧手集成度高,但自由度数目受空间限制,通常以耦合机构连接手指末端两关节。这种设计适应抓取物外形的能力较弱,拟人性较为一般;部分全驱动灵巧手保证了灵巧性,但牺牲了部分
学位
目的 分析针灸联合康复疗法对脑卒中患者吞咽困难及流涎症状的影响。方法 选取我院收治的脑卒中90例,随机分为对照组和观察组,各45例。两组患者均行常规药物治疗、健康指导及康复疗法,观察组在常规治疗基础上再予以针灸治疗,两组患者均连续治疗1个月。比较两组患者治疗前后行洼田饮水实验测试、Frenchay构音障碍测评量表中的流涎维度测评,根据测评结果评估吞咽困难及流涎症状临床疗效。结果 治疗前,两组患者洼
期刊
目的 探讨九步口腔操锻炼对改善脑血管病后吞咽困难患者饮水进食及全身营养状况的临床价值。方法 选择2017年1月至2021年4月本院收治的脑血管病后吞咽障碍患者80例,按照随机数字表法分为两组,各40例。对照组实施常规护理,如加强患者营养支持、早期康复训练等,观察组在对照组基础上联合九步口腔操干预,比较两组干预后主动参与功能锻炼及康复学习得分、两组吞咽功能相关指标;比较干预1个月后随访两组能量代谢指
期刊