面向在线分析的语义网数据存储系统研究

被引量 : 0次 | 上传用户:shuang901014
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高效的语义网数据存储、查询是实现成功语义网应用的重要基础。语义网数据采用灵活的RDF(Resource Description Framework)来表达,是一种高度稀疏的图数据。目前对语义网数据的管理通常采用三元组表、属性表等基于关系数据库的方式来管理。但语义网数据的高度灵活性、稀疏图特征,使得这些方式存在查询效率和存储空间利用率低、可扩展性差等问题。针对此有研究提出了一些语义网数据组织与查询优化方法,但大多局限于语义网数据抽取式查询,而非语义网数据分析式查询,而后者在语义网应用中非常普遍。这使得目前的语义网数据管理技术不能很好地适应语义网应用的需要。面向在线分析的语义网数据存储系统DBLink为高效的查询分析语义网数据而设计。为获得更快的存取速度,将整个数据集组织存储在主存中,并使用多种优化方式;对语义网数据按照数据类型进行分割组织,并将多值属性成组存贮,再映射回语义网的图模型视图;针对语义网上层应用的主要需求为查询、检索、分析等读操作,在底层设计上优先优化读操作的性能。查询接口使用基于图的查询表达式,其功能可以概括为抽取语义图的一个子图,或者对子图进行分析操作;提供路径选取、节点过滤、闭包等图的基本操作以及计数、分组、排序等基本分析操作的支持;内置信息检索支持,可以使用关键字搜索方式检索语义数据;复杂查询表达式可以利用加法和连接操作符将简单表达式组合而成。另外提供基本的语义图操作接口,对于查询接口不能够完成或者效率不高的分析挖掘算法,可以使用图操作接口构建。通过查询性能对比测试可以得出,DBLink的查询效率相比MySQL平均有20倍左右的提升。特别对于需要分析大规模子图的查询,DBLink体现出更大的性能优势,相比MySQL有26倍的性能提升。
其他文献
【正】 朋友;你到过大别山老区吗?你烤过大别山区的火塘吗?你喝过火塘上吊壶冲的大别山毛尖茶吗?如果你喝过一次,那将会终生难忘。我第一次享受这个殊荣,是在27年前的阴历九
期刊
目的:制备顺铂静脉注射乳剂并对其性质进行考察。方法:通过正交设计优选了顺铂乳剂的最佳处方及其制备工艺,并通过粒径、ζ电位、pH值的测定和稳定性的考察初步研究了顺铂乳
随着科技的发展许多新兴产业不断的出现,光伏产品生产制造也是一种新型产业,由于光伏设备技术发展还是初级阶段,存在着许多的问题,但它推动了设备制造行业其他的行业的不断发
贺岁电影,从产生的初衷上看,是一种带给观众愉悦享受的娱乐性文本。但是随着近年贺岁电影备受关注的趋势,及在商业利益的驱使下,贺岁电影的发展演变偏离了以往的轨道,除了它
服务贸易在世界经济快速发展的浪潮中逐步壮大,成为国际贸易大军中的主导力量,它是衡量一个国家或地区经济发展水平的重要指标。因此,服务贸易竞争力在某种程度上也代表了这
分布式文件系统通过将多台机器的资源组织起来,对外提供统一的、大容量、高性能、高可靠,易扩展的文件服务,满足了大规模应用的要求,是目前存储领域研究的重点和难点。针对文
本文从佛道二家的最高学理上对佛道关系作会通的理解,从“道与空”、“性与命”和“无生与无死”等几个方面,述说了佛道二家在其基本理论上表面对立而深层相通的情状与实质,以此
语境是交际发生时被人们实际所使用的环境,是决定语言的理解和使用的重要因素。自从语境概念正式被提出,各国语言学家就对其非常重视,现在语境已成为语义学、语用学、语体学
吟诵是一种依据文字的声调行腔使调的读书法,是介于诵读与唱歌之间的汉文古典作品口头表现艺术形式。吟诵自由、即兴,重在因声求气,涵咏入境,亲切地体会作品而没有乐谱的限制
随着我国医疗体制改革的逐步推行,加快了多元化办医的格局的形成,鼓励民营资本开办非营利性医院,医疗市场的竞争将更加激烈,将大大促进了医疗行业人力资源的流动。民营医院要