大规模RDF图上的多元化查询方法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:abc870617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展及其对知识需求的急剧增加,知识图谱应运而生。大部分知识图谱使用RDF描述资源,RDF图上的SPARQL BGP查询是对各类知识图谱进行描述、挖掘及分析的重要技术。RDF图上的SPARQL BGP查询等价于子图匹配问题,而由于子图匹配问题已被证实为NP问题,因此,如何在大规模RDF图上进行高效的SPARQL BGP查询是一个极具挑战的问题。本文针对不同查询约束的语义查询设计了大规模RDF图上的多元化查询方法。首先,当执行谓语常量约束的SPARQL查询时,使用本文类星型结构的分布式存储与基于谓语常量的标签树索引方式,执行查询图预处理和类星型结构匹配过程,通过减少查询迭代次数以及索引高效的剪枝过滤效果加快检索速度,并利用E-MJOC算法基于类星型结构选择性确定各查询子图匹配及连接顺序进行查询优化,通过减少中间结果的产生降低连接代价进而提升查询效率。其次,当执行混合常量约束的SPARQL查询时,本文设计了节点分区索引和基于布隆过滤器的编码树索引,在进行查询图预处理和类星型结构匹配时,根据RDF数据图中割点信息和节点分区索引缩小计算范围避免了无关存储节点不必要的计算,再通过基于布隆过滤器的编码树索引进行有效剪枝过滤,减少待匹配中间候选集合,降低匹配代价。最后通过MS-MJOC算法生成相应的匹配及连接查询计划对得到的中间结果基于公共点进行连接,通过减少大量连接操作而提升整体查询效率。最后,采用了不同的RDF数据集进行实验对比,实验结果表明,本文SPC的存储与索引方式以及对查询本身进行优化的方法对谓语常量约束的语义查询起到促进作用。另一方面,本文的SMC在进行混合常量约束的语义查询时的查询效果较SDec和S2X更好。
其他文献
[目的]荆芥作为解表药为我国临床常用的药材,在新型冠状病毒的治疗过程中有应用,目前栽培资源较多。研究划分荆芥在我国的适宜生长区,并对不同产地药材的挥发油进行分析,从而为种植环境的选择及药材的质量控制提供依据。[方法] 通过生态适宜性区划研究,划分荆芥的最适宜区、较适宜区、不适宜区,利用气相色谱-质谱联用技术(GC-MS)分析不同产地荆芥及荆芥穗的挥发油成分,通过正交偏最小二乘法判别分析(OPLS-
家禽喂料系统的演变和发展各有不同,中国与欧美一些发达国家相比,在家禽喂料系统的研究发展上有些落后。从家禽养殖设备的构成上来看,主要由八大系统组成,分别是:笼架系统、喂料系统、饮水系统、照明系统、通风系统、物联网系统、集蛋系统以及粪污处理系统。本文主要就喂料系统的一些关键点进行讲解。
期刊
实验教学作为学生实践性学习的重要载体,其改革已成为当下高效课堂打造的重要议题。数字化实验的引入是"双减"下实验教学改革的重要突破口。我校基于数字化实验资源建设和应用推进,探索实验教学改革模型,形成常态化应用的路径、策略与方法,实现实验教学创新,提高学生实践性学习能力。从实际问题入手,确立改革突破口,探索多学科实验数字化改革学校对实验教学现状进行了摸底,发现主要存在以下问题:
期刊
笔者本文展示的原创试题为2019年12月参与教学考试杂志社举办的"优师计划"原创研发项目的最终研究成果。原创试题素材参考了梁杰等人撰写的《白云荔湾深水区新生界生物礁识别与发育模式及主控因素探究》一文和地质出版社舒良树主编的《普通地质学》一书。
期刊
我国是养鹅大国,养殖业占据世界的主要地位。与鸡、鸭等产业相比,我国养鹅产业是个新兴产业,相比国外也是优势产业。因此不仅要改善规模化的饲养管理更要加大对鹅流行性疾病的防控,将我国养鹅产业打造成为领先世界的产业。研究并制备出可以提高鹅免疫力的生物制剂对我国鹅业的可持续发展具有深远意义。鹅α干扰素是一种体内分泌的细胞因子,具有抗病毒活性、抗肿瘤活性、免疫调节等良好功能,属于广谱的抗病毒制剂。本研究采用R
新课程改革以来,如何落实地理核心素养是一线地理教师一直在思考的问题,结合笔者任教的两个班级的任务反馈情况,发现学生在地理核心素养方面具备了一定的地理实践力、综合思维、区域认知水平,但人地协调观能力还有待提高。一、地理核心素养的内涵研究学生发展核心素养是落实立德树人根本任务的一项重要举措,教育方针通过核心素养转化为教育教学实践可用的、教育工作者易于理解的具体要求,明确学生应具备的必备品格和关键
期刊
基于水电机组控制系统老化、核心部件“卡脖子”、软硬件兼容性不足、多产品联通困难等运行状况及存在问题,针对某水电机组配置全国产华能睿渥HNICS-H316水电机组计算机监控系统,介绍该监控系统解决上述问题的设计与实施方案。首先,采用双环形+双星形的混合网络架构模式,下位机采用华能睿渥FCP100型PLC,集成系统的软硬件国产率为100%;其次,根据监控系统迁移及改造过程的难点,解决新老监控系统平稳过
产品质量在各国一直受到高度重视,一个高效的质量控制图对于提升产品质量,提高生产效率至关重要.质量控制图可以在生产过程中对产品的均值进行监控,而监控方差的控制图以及联合监控均值和方差的控制图也同样重要,因此设计一个高效的监控方差的控制图以及对均值和方差进行联合监控的控制图也越来越受到研究者们的关注.本文首先介绍了一种新型的监控均值漂移的记忆型控制图――均匀加权移动平均(Homogeneously W
李超代数的研究主要包括结构,分类和表示.从基域的角度可将李超代数分为非模李超代数(即特征零域上的李超代数)和模李超代数(即素特征域的李超代数).众所周知,特征零域上的李超代数取得了丰富的成果,但模李超代数的情况并非如此,导子代数是李超代数研究中非常有用的课题.本文基于O型模李超代数偶部的生成元,利用计算齐次导子的方法,给出了O型模李超代数的偶部导子代数和其偶部到奇部的部分导子.第一章,介绍了模李超
以4-氟苯胺为起始原料,依次经环合、氯化、偶联、烷基化、还原以及亲核取代反应,设计并合成了10个新型的2-三氟甲基-4-氨基喹啉衍生物(5a~5e、6、7a~7d),其结构经1H NMR、13C NMR、19F NMR及MS(ESI)表征。采用MTT法评价了目标化合物对前列腺癌细胞(PC3、LNCaP)和慢性髓系白血病细胞(K562)的体外抑制活性。结果表明:在5μmol·L-1浓度下,化合物5b