基于NoSQL的本体存储与查询研究

被引量 : 0次 | 上传用户:sssyyyfff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义网(Semantic Web)的提出开启了人和计算机能够相互理解的时代,它使得网络资源携带一种元数据信息,从而能够在计算机之间以及人与计算机之间准确传达语义信息,这种元数据就是RDF(Resource Description Framework,资源描述框架)数据。随着语义网技术的不断发展,包括RDF数据和OWL(Web Ontology Language,网络本体语言)数据在内的元数据统称为本体。随着本体技术在不同领域的广泛应用,本体数据的规模也超出了传统存储系统的管理能力,如何对海量本体数据进行有效存储和高效查询成为难题。No SQL(Not only SQL)和分布式存储与计算技术的迅速发展为本体数据的管理提供了新的解决方案,越来越多的语义网研究者已经开始致力于这方面的探索。本文围绕着No SQL和本体存储与查询开展了如下工作:①在语义网技术的研究背景下,介绍了相关技术的发展现状以及现有的基于传统关系数据库、分布式系统、Hadoop平台的本体存储系统。②总结现有的本体存储模型的优缺点,提出了一种基于HBase(Hadoop Database)数据库的本体存储模型,将OWL本体描述数据按照类和属性以键值对的形式分开存储在两张HTable表中,并用列族对类和属性进行划分,RDF实例数据冗余存储在SPO_C、POS_C、OSP_C三张HTable表的行健中,充分利用HBase行键的字典索引对RDF数据进行索引存储。③基于本文提出的本体存储模型,提出了三元组匹配算法、三元组模式匹配算法、基本图模式查询算法、扩展的语义查询算法以及基于Map Reduce的查询连接算法,其中利用队列结构来对查询进行语义扩充,预防语义扩充死循环的发生,支持子类、等价类、子属性、等价属性、逆属性、对称属性六种语义。④在分布式集群环境下利用本文设计的存储模型和查询算法在不同的LUBM(Lehigh University Benchmark,里海大学基准)数据集上进行性能测试,包括数据加载性能测试和数据查询性能测试,通过与传统关系数据库进行数据加载对比试验、在不同数据集上的6种LUBM查询对比试验、与不同存储查询系统的综合实验和对比分析,验证了本文提出的基于No SQL的本体存储与查询策略的优越性。
其他文献
为了探讨猪瘟脾淋苗与细胞苗阻断带毒母猪垂直传播的效果,以3个有代表性的规模化猪场为研究对象,将带毒母猪随机分成3组免疫接种。试验Ⅰ组采用脾淋苗1.5头份免疫,试验Ⅱ组采
<正>2009年5月,在安徽省科协的积极争取和中国科协的大力支持下,合肥成为中国科协第四个海智计划工作基地。我们立足安徽实际,充分发挥科协组织人才荟萃、联系广泛的工作优势
苏共二十大确实从国际、国内和党内三个方面提出了一系列非斯大林化的方针,尽管程度有所不同。二十大路线及其产生的过程告诉人们:苏共二十大提出的问题,绝不是某个人的突发
<正>坟场又是坟场,不错。写一百次都是坟场!美国最吸引我的是它可爱的坟场。没有围墙的,在我们附近的,它们仿佛是每个都市里面的诗城,以鸟语一样愉快的宁静吸引我们,比公
目的探讨双水平无创正压通气(BiPAP)对艾滋病肺孢子菌肺炎(PCP)所致呼吸衰竭的临床疗效。方法2012年1月~2013年5月期间,在我院诊治的48例HIV感染者中,对因肺孢子菌肺炎所致的
地质雷达技术在高速公路路面检测工作中的有效运用进行分析和探讨,充分的发挥出公路路面检测的技术效能,通过研究分析的方式,对地质雷达技术进行有效的分析,最终得出路面检测
苏共二十大和波匈事件接连给社会主义阵营带来了强烈的冲击,苏联和东欧各国在不同程度上陷入了困境,而中国共产党凭借其经验、实力和理论水平,在国际共产主义运动中的威望和
进入新时期以来,为改善人居环境,提升城市景观,我国在新建大量城市公园的基础上,也纷纷将建设重心转向由“增量”到“提质”的阶段,开始注重对原有的、因为建成年代久远而产
杨芳灿是清代乾嘉间著名的文学家,诗词、骈文兼工。杨氏认为骈文虽属“小道”,但欲求其工实非易事;骈文是文学发展的必然产物,应以宽广的审美胸襟来欣赏它的美;在骈文创作中,应综合
从淮安市城南栽培番茄的菜园土中分离出绿色木霉HT-01,研究不同培养条件对该木霉菌丝生长和孢子产生的影响,以及该木霉对番茄灰霉病的抑制效果。结果显示,25℃、pH为5时最有