面向关联开放数据的关联发现框架研究——以科学数据与科技文献的关联发现为例

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:pooh__5210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联数据范式为基于Web的数据、信息及知识发现带来了新的模式,其中RDF链接扮演着重要的角色。然而与关联开放数据(LinkedOpenData,LOD)资源的飞速发展极不协调的是,LOD资源之间的关联程度有待进一步的揭示和提高。另一方面,科学数据和科技文献作为知识的不同载体,具有切实的关联需求。在该背景下,LOD资源之间的关联发现具有很大的意义。然而,由于关联发现是一个极其复杂的过程,因此急需一种关联发现框架来辅助完成关联的自动发现。   关联数据的发布和互联已成为近年来关联数据领域的突出问题,已经有很多成熟的关联发现框架推出,如SILK、LIMES、RDF-AI、LDIF等。然而,目前这些框架都忽略了关联发现是一个面向整个关联网络的、涵盖多种任务的、多次迭代的、无法一步到位的过程,因此对整个关联发现的过程缺乏宏观的支持,缺乏对整个动态过程的统一的、系统化的描述,以及缺乏灵活的流水线机制。另外,在规范语言、比对算法模型、鉴别机制、中文信息处理等方面,这些框架也存在着待改进的空间。   继现状综述之后,本文在第3章首先分析了关联发现的目标和任务,结合各项任务中RDF操作的共性特点,创造性地提出了RDF分子原子的概念,并采用RDF反应的概念实现对RDF变换操作的形式化描述,继而将关联发现的整体过程解释成RDF反应堆中RDF反应链的执行过程。以上这些构成了RDF反应论的基本内容。紧接着,本文基于RDF反应论,提出关联发现框架ARIF(AnotherResourceInterlinkingFramework),并在第4章针对ARIF框架的四个关键问题展开研究:RDF反应的规范化表达问题、整个链式反应过程中需要考虑的溯源机制、基于LOD参考库的RDF分子鉴别机制以及基于投票决策的RDF分子比对模型。   在第5章,本文重点介绍ARIF框架的软件体系,指出ARIF软件体系由RDF反应链配置工具、RDF反应链自动规划工具、关联发现引擎ARIF-Engine、反应过程监控与可视化工具、LOD参考库包装器、关联网络发布工具、可视化分析工具等构成。在对ARIF-Engine的三层软件架构,即接口层、任务层和算法层做了简单介绍之后,本文针对ARIF-Engine设计过程中的两个关键实现技术做了详细介绍,包括RDF反应规范语言的实现与解析以及RDF反应过程的封装与执行。   最后,在第6章,本文通过科学数据与科技文献的关联发现实例,验证了RDF分子原子说、RDF反应等理论的有效性,验证了基于RDF反应堆的ARIF-Engine的实用性。实验表明,目前给出的五类RDF反应已经足够满足关联发现的需求。ARIF模型中的RDF反应规范语言、LOD参考库以及溯源机制达到了预期的效果。另外,通过两组实验的设计,进而验证了ARIF-Engine关联发现结果的准确性,并验证了ARIF-Engine针对多重优先级比对规则的执行性能较其他的关联发现框架具有一定的优势。
其他文献
本文通过对荣华二采区10
《中图法》是以科学分类和知识分类为基础,并结合文献内容特点及其某些外表特征进行逻辑划分和系统排架的类目表。它是类分文献、组织文献、分类排架、编制分类检索系统的工具
突破性创新(disruptive innovation,DI)包含市场突破性创新和技术突破性创新,技术突破性创新包括基于引用科学知识突变的突破性创新和基于技术知识突变的突破性创新,本文主要研
针对鞍钢新4号高炉燃料消耗较高的问题,通过建立三元碱度模型,采取差异分位布料方法进行炉料的合理搭配,实施以中心为主、适度疏松边缘的布料模式,用以改进炉料的还原效果;下
期刊
在网络日益成为最重要的科学交流和传播渠道的今天,很多重要的科技战略、科研活动、科研成果、基金资助等与科学研究和科技战略决策相关的信息都可以直接通过网络获取。利用网
随着知识经济的发展、数字信息环境的变化,情报活动从传统领域中走出来,成为一种社会活动广泛存在于科技、经济、教育、军事、政治等各个方面。数据分析时代的到来,将情报分析严
通过加压冶炼、控制轧制方式获得氮质量分数为0.59%的Mn18Cr18N钢板,研究了终轧温度对高氮奥氏体钢组织和力学性能的影响.结果 表明,在再结晶区轧制并且终轧温度为970℃的钢板
随着新课程改革的进一步推进,英语作为最重要的信息载体之一,已成为人类生活各个领域中使用最广泛的语言。如何使课堂教学更有效果,如何将新课标的思想理念、方法手段运用到日常
我国经济进入调整期后,人民币汇率走势的不确定性将增加,汇率变动将成为经济决策与预测的重要考量因素自2007年9月以后,人民币汇率出现了加速上升趋势,逐日迫近7:1的市场心理