云环境下海量语义数据查询策略研究

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:kwok916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  为了实现对海量RDF数据的高效查询,研究了RDF三元组在分布式数据库HBase中的存储方法,基于MapReduce设计了海量RDF数据的两阶段查询策略,将查询分为SPARQL预处理阶段与分布式查询执行阶段。 SPARQL预处理阶段设计实现了基于SPARQL变量关联度的查询划分算法JOVR,通过计算SPARQL查询语句中变量的关联度确定连接变量的连接顺序,根据连接变量将SPARQL子句连接操作划分到最小数量的MapReduce任务中;分布式查询执行阶段执行SPARQL预处理阶段划分的MapReduce任务,实现对海量RDF数据的并行查询。在LUBM标准测试数据集中的实验表明JOVR算法能够高效地实现对海量RDF数据的查询,并具有良好的稳定性与可扩展性。
其他文献
紫外光固化涂料是一种节能和环境友好型涂料,与传统涂料相比,其具有低毒性、原料价格便宜、固化速度快、配方简单和操作方便等诸多优点,因而其发展前景十分广阔.紫外光固化涂
UV(ultraviolet,紫外光)固化是一种新型"绿色"涂料固化技术,和传统的涂料固化技术相比,具有固化速率快、涂膜性能好、环境污染少、能量消耗低的优点.但UV固化涂料体系粘度普
  分布式系统中主流数据传输技术是基于以太网的套接字编程,其上层的协议是TCP/IP,这种传统方式中所有的数据要在用户缓冲区和内核缓冲区进行多次数据拷贝,需要极大的内存
会议
体液里的病毒中和抗体在抵抗流感病毒感染的过程起到重要的作用,利用康复者的血清能治愈被流感病毒感染的患者。血凝素(HA)神经氨酸酶(NA)、M2是A型流感病毒主要的膜蛋白。近
学位
要真正挖掘“浦东概念板块”的潜力,就必须以浦东6家国资国企下属上市公司为核心,通过这些公司自身的发展来带动整个板块的提升。这6家上市公司应该向金融方面转型,这既是配
研究乌鲁木齐含硫冷泉水体细菌多样性及水体细菌群落与水文理化因子的响应关系,分析细菌群落在地震前后的变化规律。通过运用T-RFLP技术对乌鲁木齐含硫冷泉水体细菌进行群落多
  近年来,分类体系匹配由于其在知识库构建和融合等方面的广泛应用,已成为国内外工业界和学术界的研究热点.然而,随着网络大数据的不断发展,分类体系变得越来越庞大和复杂,
会议
  手机内置加速度传感器坐标系固定于设备自身,其采集的数据因手机姿态的改变而不断发生漂移,受此影响即使同一运动过程,加速度数据也难以同前一个时刻保持一致。为解决该问题
会议
本文主要考察了rCHO细胞的无血清适应过程和其在批培养和谷氨酰胺限制流加培养过程中的生长、代谢特性.首先通过无血清适应过程,使原本需要贴壁和有血清培养的rCHO细胞成功实
芳基吡唑衍生物作为γ-氨基丁酸氯离子通道抑制剂在杀虫剂,抗菌剂,抗炎剂等方面有很大的运用。一系列具有C-P键的α-氨基膦酸酯常作为α-氨基磷酸的前体,可以模仿生物体内的氨基