【摘 要】
:
目前存在RDF图数据关键字查询研究主要集中在构造包含查询关键字的最小树/子图的图搜索算法,忽略了RDF数据间关联的语义信息,此外集中式处理方式也难以适应不断增长的RDF
【机 构】
:
福州大学数学与计算机科学学院 福州福建中国350108
论文部分内容阅读
目前存在RDF图数据关键字查询研究主要集中在构造包含查询关键字的最小树/子图的图搜索算法,忽略了RDF数据间关联的语义信息,此外集中式处理方式也难以适应不断增长的RDF数据的查询要求。本文提出了一种基于语义关联的RDF关键字并行查询方法KPQRSA(Keyword parallel query over RDF data based on semantic association),结合本体OWL和概率模型设计评分函数来度量语义关联度,分布式数据库Hbase作为存储媒介,利用MapReduce计算框架并行查询:在Map阶段查询关键字节点得到语义关联密切的子簇,在Reduce阶段执行连接操作,并构造一系列关联的联通簇作为查询结果。实验验证,KPQRSA算法有助于提高查询结果的内容与关键字的相关度,保证结果的查准率,同时分布式存储和并行计算查询具有较好的可扩展性。
其他文献
分析了语言对于文化安全的重要性和国内外相关工作。在此基础上,讨论了传统濒危语言保护方法的局限性。以社会计算为新的研究视角,构建了以ACP为框架,以模因理论、情景分析
一个设计师最重要的不是就单一的具体的事物进行设计,就设计而去设计,而是往往通过很多其他的辅助的事物产生某种灵感或者启发。
The most important thing a designer does
核心成员对网络社区中话题发展趋势及其参与者的舆论倾向具有十分重要的影响。本文提出一种识别网络社区中核心成员的方法,以此为基础构建基于核心成员行为的话题发展趋势
本文使用根据年龄组变化预测人口的Leslie模型预测未来的人口结构,以山东省为例,根据人口普查数据、生育意愿调查及独生子女所占比例,分别估计出在独生子女政策下和单独二胎
A eco-reliable path is defined to show reliability and sustainability in ecological shortest path problem.A 0-1 integer programming is formulated,in which t
RDF数据规模随着语义网的发展不断增长,大规模RDF数据的查询处理面临巨大的挑战.为了解决当前RDF数据查询效率低下的问题,提出了Spark平台上一种新的分布式RDF数据查询算法RQ
在小麦籽粒的生长发育过程中,生产的最终产量受到灌浆情况的重要影响。不仅籽粒的质量好坏受到灌浆的影响,而且籽粒的产量多少也受灌浆的控制。为了提高小麦的质量和小麦的库容、增加小麦的产量,需要研究小麦灌浆过程的反应机理,而灌浆过程需要的水分是由小麦茎秆输送的,所以有必要对灌浆过程中小麦茎秆中的水分特征进行探索。在传统的水分研究方法中,对小麦在灌浆过程中茎秆的水分分布情况和相态变化情况都研究的比较少。并且
The purpose of this paper is to present a new Hardy space approach of Dirichlet type problem.This reduces to a simple extremal problem when considering Hard
Real Time Bidding(RTB)is emerged with the rise of Internet and big data,and it realized precision marketing through the market segmentation strategies of De
本文以机械钻孔形成的微米多孔金属膜为掩膜,以聚碳酸酯(PC)、聚酰亚胺(PI)为基膜,电子束通过掩膜上的小孔,辐照(蚀刻)高分子基膜,再用化学试剂腐蚀已蚀刻的高分子膜,利用辐照和未