面向大规模RDF数据的高效率语义索引关键技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:mfktadxxxa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义Web领域的发展,各个领域按照语义Web的数据格式发布的数据逐年呈几何级爆炸性增长。Linked Open Data上的RDF数据条数已经达到百亿级规模。针对RDF数据主要有查询和推理两类工作。高效的查询工作依赖于数据底层的索引结构;而推理工作则需要依据语义Web中的推理规则在数据上做闭包计算工作,具有较高复杂度。当前针对大规模RDF数据的查询以及推理已有大量的工作,但其不足主要体现在RDF存储中的索引主要是结构化索引,并未包含有语义信息;而在推理方面都是离线推理,不支持查询时的实时推理。本文通过研究RDFS的推理规则,结合ORDPATH编码机制提出了资源前缀编码来展现RDF数据资源的层次以及蕴含关系,并提出了一种面向大规模RDF数据的语义索引构建方案。对RDF数据中的ABox和TBox进行区分,通过资源前缀编码来分别构建TBox的语义关系,并将构建的语义编码信息持久化到RDF三元组索引中,使得三元组索引承载有语义信息。其显著特点是,通过对RDF数据的查询即可得到RDFS蕴含知识,通过这样一种结合在线和离线的推理方式实现了RDF蕴含机制(Entailment Regime)。针对设计方案进行了实现,设计并进行了一系列实验,对比了语义索引与一般索引在存储和查询时的性能和结果。本文的分析和实验表明,支持语义的索引结构在数据加载的空间开销和时间开销方面,以及在数据查询方面没有给不支持语义的传统RDF索引增加显著额外负担和开销,但获得了在查询时对推理的有效支持,实现了RDF数据的实时推理功能。
其他文献
在数据库系统和计算机视觉两大研究领域的推动下,基于内容的图像检索技术已经成为当前的一个研究热点。本文针对这一课题,分别在基于颜色、纹理和形状的检索技术方面进行深入研
在过去的三十年里,软件工程技术得到了快速的发展和运用,这毫无疑问的造就了软件产品的重大改进。然而,面对现在环境和需求的快速持续变化,多数的软件系统仍保持着内在的易碎性和
彩铃业务是“个性化多彩回铃音业务”(Coloring Ring Back Tone)的简称,是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。该项业务由
入侵检测技术是保护网络系统的重要手段之一,基于主机的入侵检测系统主要用于对重点主机实施防护,具有检测效率高和检测准确性高等优点。系统调用是外界进入系统的必经之路,是攻
随着网络宽带化的发展,流媒体作为新兴的媒体形式应用日益广阔,但是其版权问题也日趋突出。流媒体的数字版权管理在这种情况下越来越受到人们的重视,越来越多的公司、组织投入其
民用航空运输在交通运输行业的比重不断增长,使得民用航空的安全水平也越来越受到关注。我们需要采取积极主动的安全检测监控措施,提高现有民用航空领域的安全性。飞行品质监
数十年来,数据挖掘一直是一个热门话题。作为数据挖掘的一个主要技术领域,聚类分析产生了很多算法,并且演化成一个庞大家族。现有的聚类算法可以分为5类:分割算法,分层算法,基于密
随着当代企业内部结构逐渐分散,网络应用服务模式面临新的问题,即在不影响最终用户使用的前提下,实现在任何地方灵活地访问应用服务。虚拟专用网在此基础上逐渐发展起来,其中
随着网络技术和通信技术的不断发展,用户对网络的需求日益多样化,基于IP 交换网络的多点视频会议系统的实现由于其成本的低廉,交互性强大,多点共同参与的特点和优点取代了传
随着Internet的迅猛发展,使得World Wide Web已经深入到社会生活的方方面面。Web已经发展成为拥有数十亿页面,蕴涵着具有巨大潜在价值的分布式信息空间。人们迫切需要从这些