【摘 要】
:
随着语义网的快速发展,RDF语义数据大量涌现.大规模RDF语义数据推理的一个主要问题是计算量大、完成计算需要消耗很长的时间.显然,传统的单机语义推理引擎难以处理大规模的语
【机 构】
:
南京大学计算机软件新技术国家重点实验室
论文部分内容阅读
随着语义网的快速发展,RDF语义数据大量涌现.大规模RDF语义数据推理的一个主要问题是计算量大、完成计算需要消耗很长的时间.显然,传统的单机语义推理引擎难以处理大规模的语义数据.另一方面,现有的基于MapReduce的大规模语义推理引擎,缺乏对算法在分布和并行计算环境下执行效率的优化,使得推理时间仍然较长.此外,现有的推理引擎大多存在可扩展性方面的不足,难以适应大规模语义数据的增长需求.针对现有的语义推理系统在执行效率和可扩展性方面的不足,文中提出了一种基于MapReduce的并行化语义推理算法和引擎YARM.为了实现分布和并行计算环境下的高效推理,YARM做出了以下4点优化:(1)采用合理的数据划分模型和并行化算法,降低计算节点间的通信开销;(2)优化推理规则的执行次序,提升了推理计算速度;(3)设计了简洁的去重策略,避免新增作业处理重复数据;(4)设计实现了一种新的基于MapReduce的并行化推理算法.实验结果表明,在真实数据集和大规模合成数据集上,YARM的执行速度比当前最新的基于MapReduce的推理引擎快10倍左右,同时YARM还表现出更好的数据和系统可扩展性.
其他文献
采用《症状自评量表(SCL-90)》和《康奈尔医学指数(QvⅡ)》中M-R部分对学生进行心理健康测试,利用主成份分析法提取心理因子和三级模糊评判模型对大学生体质健康进行了评价。
快速阅读理解作为大学英语四级考试改革后新题型成为近年大学英语四级探讨的热点。以该题型为研究对象,根据大学英语课程教学要求和大学英语四级考试大纲的要求,从Bachman和P
2006年2月15日财政部颁布了包括1个基本准则和38个具体准则在内的新会计准则体系,新准则在固定资产的确认、计量、核算等方面发生了较大的变化。本文通过新旧会计准则对固定
在临沧山地城镇的发生、发展、演变历史中,其空间结构都是自组织作用的结果。自组织力是一种贯彻始终的影响力量,是城镇空间结构形成的内因,它总是按照一定的社会经济原则在
厕神“紫姑”是一位非常重要但常被研究者忽视的民间女神。本文考查了“紫姑”信仰的历史渊源、风俗习惯以及历代文人对其的吟咏,以期引起研究者的重视。
为了解决新能源汽车电机机壳铝合金低压铸造铸件内部树脂覆膜砂工艺制成的砂芯清理问题,提高电机机壳低压铸造的合格率,设计了自动清砂设备控制系统。该系统以PLC作为控制核
<正>设计理念本篇是苏教版第七册的课文,记叙了明朝史学家谈迁在艰难的困境中两次撰写《国榷》的感人故事,表现了谈迁逆境中的坚强意志和毅力。体会谈迁厄运打不垮的信念,并
目的 :构建科学、敏感、实用的神经外科护理安全质量敏感性指标体系,为神经外科护理安全评估与监控提供参考。方法 :通过文献研究及临床神经外科护理安全不良事件发生率统计
本文叙述了Java语言的出现背景、主要特点、发展历程以及Java技术的应用,指出Java是当今IT产业和人类文明的创新和希望。