知识图谱中子图查询技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:didierda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的发展使数据得到了爆炸性的增长,这些来自互联网及生活中的数据往往存在着紧密的关联性,图作为一种广泛应用的数据结构,非常适合用来描述这些具有紧密关联性的数据,这些数据用图组织成为知识图谱,知识图谱在社交网络、蛋白质网络和道路交通系统等领域都有着重要的应用。如何对知识图谱中大规模的图数据进行处理是一项重要的研究工作,子图查询问题作为图数据处理的基本问题受到了学术界和工业界的广泛关注。  在信息检索领域经常出现用户的真实信息需求和提交的请求之间有一定偏差的问题。在图查询领域也会存在这一个问题,由于用户对数据图领域知识的不了解,有可能导致输入的查询图信息不完整,为了更好的满足查询需求,提出了基于距离和相似度的图扩展算法,在进行子图查询时,先对查询图进行扩展,然后用扩展后的查询图在数据图中进行子图匹配。  提出了基于回溯思想的子图匹配算法LCF,该算法是在传统的子图匹配算法VF2的基础上面提出的,主要对边匹配顺序、顶点匹配顺序和剪枝判定规则做了改进。对查询图进行了基于最小生成树的分解,这样在保留查询图基本结构的基础上选取过滤能力强的边,可以尽早的过滤掉不匹配的边。在顶点的匹配顺序上,选取度数大、在数据图中同标签顶点少的顶点先匹配,尽早的过滤掉不匹配的顶点。在剪枝判定规则上,从顶点度数、顶点标签和边标签的角度考虑,提出了剪枝能力更强的剪枝规则,与传统的VF2算法的剪枝规则相比,有效的缩减了搜索空间。  经过实验验证,查询图扩展算法可以合理的完善用户的查询意图;子图匹配算法LCF比传统的算法VF2的时间效率高。
其他文献
汽车的品质特性是衡量汽车制造质量的一个综合性指标。统计表明,整车约1/3的故障问题与车辆的NVH问题有关,国际上各大汽车公司有近20%的研发费用消耗在解决车辆的NVH问题上。汽车后桥是汽车传动系统中的关键部件,其性能直接影响整车品质。汽车后桥主减装配的的故障种类繁多,如齿轮毛刺、异响等。面对这些问题,目前国内外厂商和研究机构多采用测量后桥噪音的办法来确定主减合格与否以及质量特性。齿轮故障诊断一般步
云计算环境下的资源监控是云计算平台体系结构中必不可少的组成部分,为云平台的资源管理、任务调度和负载均衡等提供重要依据。云计算是一种基于互联网的新型计算方式,其宗旨是
用例规约作为用例技术的关键部分,描述了用例的具体内容,定义了用例的细节,对后期各阶段开发工作具有重要的影响。但是,在用例的使用过程中用例规约描述方面仍然存在一些缺陷
学位
随着全球范围内分布式系统发展进程的加快及其构造的日趋复杂,越来越多的失效现象层出不穷,严重威胁着系统的高可用性。失效检测作为保障分布式系统高可用性的核心技术之一,
槽填充(Slot Filling)任务是TAC(Text Analysis Conference)会议于2009年提出的KBP(Knowledge Base Population)评测任务的主要组成部分。作为问答系统和信息抽取中关系抽取
伴随着人们日益增长的多媒体需求,多媒体技术有了突飞猛进的发展。而多媒体技术最核心的部分—视频编解码技术同样也得到了快速的发展。AVS是我国自主研发的音视频编解码标准
与国内典型的报名系统不同,跨境招生报名系统具有用户类型多、用户交流所用语言不统一、系统性能受国际出口带宽限制、系统支撑平台复杂等诸多特点,在此诸多特点下,跨境招生
高血压是严重影响我国居民身心健康的疾病,但是目前我国的医疗卫生条件并不能跟上高血压患者的就医需求,存在“看病难、看病贵”等诸多问题,因此国家大力地推进医疗信息化建
聚类是数据挖掘的主要技术之一,也是学术界研究的热点问题,并在各个领域的数据分析中起到重要作用。聚类边界的识别有助于提高聚类结果的准确性和揭示聚类所具有的特性,对它