【摘 要】
:
RDF数据规模随着语义网的发展不断增长,大规模RDF数据的查询处理面临巨大的挑战.为了解决当前RDF数据查询效率低下的问题,提出了Spark平台上一种新的分布式RDF数据查询算法RQ
【机 构】
:
福州大学数学与计算机科学学院福州350108
论文部分内容阅读
RDF数据规模随着语义网的发展不断增长,大规模RDF数据的查询处理面临巨大的挑战.为了解决当前RDF数据查询效率低下的问题,提出了Spark平台上一种新的分布式RDF数据查询算法RQCCP.该算法按照主语所属的类,谓语,宾语所属的类分割存储RDF数据,同时建立类间属性关联的索引文件:查询时利用索引文件缩小查询数据输入的范围、提前过滤无关三元组,查询中间结果缓存在内存中减少磁盘I/O,从而提高查询效率.通过在大规模RDF数据集上进行的实验证明了本算法具有较高的查询效率.
其他文献
寡糖及糖缀合物广泛的存在于生命体内,是重要的信息物质,参与多种生命活动。寡糖由于结合位置和结合类型的不同,种类繁多,有着多种重要的生物活性。黄原胶是人类研究最为透彻、商
太极两仪的历史悠久,其中包含着颜色的变化,两仪指的就是阴和阳,黑代表阴,白代表阳。在书法之中,对墨色的处理也要运用黑和白的颜色变化。可以说,太极两仪和书法笔墨有着一定
社区问答系统(CQA)逐渐成为人们在互联网上获取信息的重要来源之一,然而CQA最主要的缺点之一就是答案质量不可控,有高质量的答案,也有无用的垃圾信息。因为问题和答案之间存
In this paper,we give a novel idea to modify the fuzzy clustering method for image segmentation.In the procedure of the existing clustering algorithms,Fuzzy
针对目前有向图聚类算法存在的时延高、资源损耗大、迭代式数据处理性能较差等问题,提出一种基于Spark的结构相似度聚类并行算法(SparkSCAN):考虑网络中节点间的有向交互
分析了语言对于文化安全的重要性和国内外相关工作。在此基础上,讨论了传统濒危语言保护方法的局限性。以社会计算为新的研究视角,构建了以ACP为框架,以模因理论、情景分析
一个设计师最重要的不是就单一的具体的事物进行设计,就设计而去设计,而是往往通过很多其他的辅助的事物产生某种灵感或者启发。
The most important thing a designer does
核心成员对网络社区中话题发展趋势及其参与者的舆论倾向具有十分重要的影响。本文提出一种识别网络社区中核心成员的方法,以此为基础构建基于核心成员行为的话题发展趋势
本文使用根据年龄组变化预测人口的Leslie模型预测未来的人口结构,以山东省为例,根据人口普查数据、生育意愿调查及独生子女所占比例,分别估计出在独生子女政策下和单独二胎
A eco-reliable path is defined to show reliability and sustainability in ecological shortest path problem.A 0-1 integer programming is formulated,in which t