分布式知识图谱数据的查询与检索技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:dadiguilai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,资源描述框架RDF(Resource Data Framework)已被广泛应用于各种网络资源标记应用中。在RDF模型中,现实世界中事实都被表示成三元组形式。一个RDF数据集天然地可以被视为一个图,也就是知识图谱,其中主体和宾语是顶点,每条三元组是一条边,而谓语就是这条边上的标签。随着RDF模型被广泛地应用,现有知识图谱数据集规模也越来越大。于是,如何利用各种分布式计算环境对大规模知识图谱数据集进行查询与检索成为目前研究的难点和热点。为此,本文将研究不同分布式环境下知识图谱数据上多种形式的查询与检索,所研究的分布式环境包括联邦型分布式系统、基于划分的分布式系统等。所研究的知识图谱数据查询形式包括关键词查询、结构化查询以及距离查询。本文主要研究工作:(1)联邦型RDF数据库中的关键词查询方法研究针对多个“自治”的单机知识图谱数据管理系统组成的联邦型分布式计算环境下关键词检索难题,提出了在离线阶段生成整合单机知识图谱数据管理系统的类信息来构建模式图的方法。然后,在在线阶段,利用单机知识图谱数据管理系统提供的全文搜索接口将关键词映射到模式图上的类,并通过遍历模式图生成结构化查询。最后,将生成的结构化查询发送到相应的单机知识图谱数据管理系统来对这些查询进行处理。理论分析和实验结果表明,本文提出的方法是有效且高效的。(2)基于分区的SPARQL查询处理优化研究针对强耦合多个单机知识图谱数据管理系统的集中式分布式计算环境,为了在该环境中处理结构化查询,通常的做法是将知识图谱划分成一些更小的子图进行分布式存储。这种方法在结构化查询处理过程中面临中间结果过多的风险。本文提出了在选择分布式执行计划前先收集变量的候选项的优化方法,并设计了一个基于总运行时间的模型来评估优化的收益,用来减少中间结果的数量进而提高查询处理性能。通过在大规模知识图谱数据集上进行实验,证实了本文提出的优化方法可以有效提高性能且与现有的分布式知识图谱系统无缝结合。(3)基于地标的距离计算优化技术研究针对因为知识图谱数据体量增大,导致传统分布式图的距离计算方法效率逐渐不能满足应用需求的问题。本文提出一种基于地标的框架来优化基于云计算平台的分布式图系统上的距离计算方法,用集合介数度量来选择距离计算的最佳地标集合。通过理论分析,证明了选择最佳地标集是NP难的,进而提出了一种启发式分布式算法,以保证近似比。在大规模知识图谱数据集上进行了实验,实验结果表明本文所用方法要优于现有的几种主流方法,并且在不同基于云计算平台的分布式图系统中性能差异较为明显,其中在Pregel+中性能表现要比Giraph和Graph X快2-3倍。
其他文献
针对单干扰机生成虚假运动目标干扰方法在对抗具有地面运动目标指示(ground moving target indication, GMTI)功能的合成孔径雷达(synthetic aperture radar, SAR)系统时的固有缺陷,学者们通过利用双干扰机协同干扰的思路来解决这一问题。然而,目前公开文献关于利用双干扰机协同生成虚假运动目标的干扰方法均需要提前侦察出SAR-GMTI系统的载机平台
近年来,我国经济呈现高速发展的态势,社会资源的分配方式也随着经济的发展不断革新。在传统的社会资源分配方式被打破之后,群体之间为最大化的使用社会资源、获取利益而相互竞争,会不可避免地产生纠纷。虽然随着整体教育水平的提高,社会公众维权意识逐渐增强,但仍然存在社会公众政治参与度低、法治意识淡薄、法律知识缺乏的情形。一旦出现群体纠纷,公众缺乏制度化、渠道化的方式向行政机关寻求救济,行政机关欠缺有效平息解决
2008年3月,中央文明委发布了《中央精神文明建设指导委员会关于进一步做好评选表彰全国道德模范工作的决定》及《评选表彰全国道德模范实施办法》。自此,包括道德模范、时代楷模、中国好人、文明家庭、美德少年等在内的中央、省、市、区各级评选表彰活动相继开展,在全国各省份及地区,在社会各界、各行各业均引起了不小的反响,一度甚至成为了基层单位精神文明建设成果的集中展示和“金字招牌”。不论是行业精英、职业能手、
本文以秦昭王时期的军政外交为主要内容,分四章进行论述。第一章是秦昭王继位前秦国面临的形势,以六国的发展情况为主线进行分析。可以看出,魏、韩两国在和秦国的关系上处于被动的局面,赵国和燕国国势则开始上升,齐国实力正值巅峰,楚国已经开始衰弱。秦国则在进行变法后,抓住各国此强彼弱、明争暗斗的机会,使秦国成为最强大的国家之一,但是仍然受到齐、楚、赵等国的限制。第二、三章根据军事方针的阶段变化,将秦昭王时期的
针对间歇采样转发干扰(interrupted sampling repeater jamming,ISRJ),本文研究了脉内正交的工作波形和保护波形设计方法抑制干扰,考虑到设计波形的多普勒敏感性,以低多普勒敏感约束和互相关函数加权和最小为目标函数,波形恒模为约束条件建立优化问题,由于该问题包含非凸四阶目标函数和非凸约束,难以得到闭式解,因此设计了一种基于循环算法的方法进行求解。最后,通过仿真实验和
将对异戊二烯聚合具有高选择性的稀土催化剂1~5,在助催化剂有机硼盐和烷基铝的作用下,用于催化硅烷基保护的极性共轭双烯单体IP-OTBS均聚合,制得了顺式1,4-结构单元含量最高为98.5%和3,4-结构含量最高达82.2%的聚(IP-OTBS). PNP-型稀土钇催化剂2催化IP-OTBS与1,3-丁二烯(BD)、异戊二烯(IP)无规共聚合,制备出了极性基团含量分别为10.2%和16.7%的顺丁橡
随着双碳经济的提出,智能电网正朝着节能减排的方向发展,而用户的异常用电造成电力资源严重流失。针对传统异常用电检测方法精度低、运行效率慢等问题,提出了一种将LightGBM模型与改进的长短期记忆网模型相结合用于异常用电检测。通过采样和Lightgbm模型相结合进行异常检测,并通过改进长短期记忆网模型给出异常用电类别。通过试验分析了所提方法的优点。结果表明,与传统的检测方法相比,该方法能够快速有效地检
经济法的学习内容相对枯燥,为了让学生对知识点理解得更加透彻,需要教师适当引入相关案例,为学生搭建分析问题和解决问题的平台,从而避免填鸭式的理论教学,增强学生的法律理解与应用能力。本文通过分析案例教学法的优点,阐述了案例分析法在经济法教学中的应用方法。
目的 研究减重活动平板联合PNF技术对偏瘫儿童步态训练中平衡功能的影响,为临床上的偏瘫儿童提供参考,以改善偏瘫儿童的步态训练。方法 选取2017年1月—2020年1月昆明市儿童医院收治的偏瘫患儿200例,按照完全随机法分为PNF技术组和联合组各100例。PNF技术组患儿使用PNF技术训练,联合组患儿使用减重活动平板联合PNF技术训练,评价患儿步态训练参数值、偏瘫侧膝关节位置觉、运动觉、GMFM-8
细胞是生命体形态结构和功能活动的基本单元,实现着物质代谢、能量转换和信息传递等一系列生命过程。原始细胞模型(Protocell)是一种人造细胞,是人们对地球最原始生命的设想,拥有最简单、最原始的腔室结构。原始细胞具有制备相对简单、结构相对稳定等优势,有望代替功能障碍的真实细胞,在细胞生物学、化学生物学和生物医学方面具有潜在的应用前景,并且原始细胞研究将为生命起源提供理论与实验依据。然而目前原始细胞