基于本体的关联数据质量评估方法研究

来源 :东北石油大学 | 被引量 : 1次 | 上传用户:cdzq911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义网技术的不断发展,网络上的语义数据呈现出爆炸式的增长,知识图谱的提出和发展,让网络语义数据的研究和应用更为普遍。作为网络语义数据存储和交换的载体,关联数据的发布量和使用量也是呈指数级增长。由于网络的开放性和共享性,许多单位都将各自领域的数据通过关联数据技术发布到网络上供大家使用。但是数据发布者遵循的标准不统一,发布的关联数据其数据质量也难以保障,使得关联数据的数据质量问题成为阻碍关联数据应用的关键因素。为了减小关联数据质量问题所带来的影响,众多企业和单位都在寻求有效的关联数据质量评估的方法,很多国内外学者也纷纷加入到关联数据质量的研究中。针对关联数据质量的研究,一些专家认为关联数据质量问题本质上就是数据质量问题,而有的学者将关联数据质量单独作为一个研究方向。但是至今关联数据质量评估也没有形成标准化的评估方法。国内学者大多更专注于对关联数据质量评估方法的统计分析。为了解决关联数据质量评估中评估方法效率和集成度偏低等问题。首先,本文对关联数据、关联数据质量相关文献进行研究,对国内外的研究成果进行对比分析。认真讨论了关联数据质量评估中的关键维度,对比了关联数据质量的检测方法。其次,能够完成对关联数据可用性、延迟、吞吐量等方面的检测。再次,目前关联数据质量评估模型不规范,本文对数据质量评估模型,以及关联数据质量评估模型进行研究和分析,使用Jena按照七步法构建了用于关联数据质量评估的LDQA(ontology for Linked Data Quality Assessment)本体,LDQA可以规范关联数据质量概念,并且能够利用其推理功能进行数据挖掘,挖掘关联数据集中部分缺失数据所对应的正确数据,提高评估的准确性。最后,利用LDQA对关联数据的语义规范功能,对关联数据集中语义的准确性进行检测。同时本文使用动态规划方法和多线程技术提高评估的效率。本文以油田开发数据为背景,设计并实现了关联数据质量评估系统。该系统集成了关联数据质量不同维度的评估方法。提供了评估本体的维护界面。能够实现对本体及推理规则的维护升级。并且用户和管理人员操作入口分离,降低了系统使用的复杂度,成功实现了关联数据质量高效、准确评估。验证了本文所提出的基于本体的关联数据质量评估方法的有效性和可行性。
其他文献
诺丽是双子叶植物纲茜草科中的一种,也被称为海巴戟。诺丽果内部含有众多的活性成分和营养物质。其内部的多酚和黄酮类物质可以大幅度的减少人体内过氧化物酶活力,缓解自由基对人体的伤害。诺丽果的加工手段众多,诺丽果汁是其目前最主要的商业化产品。热处理是果汁加工业中重要的一环,通过热处理的食品相对安全期较长,但是会损害果汁的营养结构和活性物质的抗氧化性,其风味也会受到影响。本研究采用不同热处理改善原料的特性,
随着5G的商用,物联网、车联网和人工智能等一系列技术将得到快速发展,无线电设备的数量将呈指数型增长,这给当前的频谱管理带来了诸多挑战,如频谱资源紧缺、安全性威胁、维护费用高等。基于认知无线电的动态频谱共享技术为解决频谱紧缺问题提供了方向,不同无线接入网络、不同无线接入技术共享同一频谱资源已成为一种新常态。然而,如何保证共享网络中不同频谱管理系统安全、无干扰地共享频谱是亟待解决的问题。近年来,区块链
龙舟运动有着两千多年浓厚的优秀历史文化内涵,具有历史性、开放性、继承性和民族性等特点,是一项历史悠久的民族传统体育项目,是龙文化中最能体现龙之精神内涵“团结合力”的一项水上运动。第一次国际龙舟比赛的举办,成功将龙舟运动推向世界各地。上世纪90年代始,高校龙舟运动开始如沐春风般迅速兴起,全国各地举办龙舟赛增多,类别增多。随着社会发展进程加快,龙舟运动真正演变成竞技体育项目,国际化程度增强。江苏省是最
锂硫电池具有高理论比容量(1672 mAh g-1),高能量密度(2567 wh kg-1),高自然丰度,价格低廉以及环境友好等优点,被认为是最有潜力的下一代化学储能设备之一。但在其商业化道路
MEMS陀螺仪具有小尺寸、轻重量、低成本、低功耗和高集成度等很多优点,因此在工业控制、电子产品和国防建设等诸多领域MEMS陀螺仪都得到了广泛的应用。但是MEMS陀螺仪对温度量变化敏感,在温度突变的环境中,会导致MEMS陀螺仪漂移增大,从而使MEMS陀螺输出误差增大。为了减小温度变化对MEMS陀螺仪精度的影响,提高MEMS陀螺测量精度,可通过设计温漂补偿的方法,对MEMS陀螺仪输出进行数学模型补偿。
压载持续作用下混凝土中的氯离子传输性能研究是海洋环境下混凝土结构耐久性研究的重点和难点。本文针对压载持续作用下混凝土中的氯离子传输性能展开研究:采用理论分析、数
本文为研究再生混凝土抗硫酸盐干湿循环侵蚀性能,利用再生粗骨料、水胶比与矿物掺合料的性能特点和有利作用,同时作为试验影响因素,通过模拟硫酸盐干湿循环侵蚀环境对正交设
老山芹(Heracleum moellendorffii Hance)作为一种重要的药食同源类山野菜,不仅营养丰富,而且具有很好的保健功效。由于野生老山芹被人们不合理采挖,以及自然生长的季节性,难以满足人们的周年需求。本试验通过研究不同时间的低温处理、不同浓度赤霉素浸根处理对老山芹萌发及生长的影响,拟明确老山芹休眠解除的适宜方式;通过研究种植密度、肥料处理、基质相对含水量对老山芹生长的影响,拟明确
作为一种新型水介质分选旋流器(Water-only Cyclone,WOC),三锥角旋流器(Three-stage Cone Water-only Cyclone,TWOC)拥有三段角度逐渐递减的锥体,改善了传统单锥角水介质旋流
在生存分析中,存在一种特殊的左截断数据——长度偏差数据,该数据的重要特征是截断变量服从均匀分布。当数据类型为长度偏差时,使用原先关于左截断数据的统计推断方法会导致估计结果不准确,因此需要找出适用于长度偏差数据的统计推断方法。Cox比例风险模型是生存分析中一种常见的模型,该模型描绘了协变量对风险函数的影响。目前,此模型被广泛应用在经济学、社会学和生物医学等领域。此外,由于测量仪器精度或测量成本等因素