论文部分内容阅读
人类社会正以惊人速度产生海量数据,信息总量每18个月就会翻一番,“大数据”时代已经来临,以数据密集型计算为特征的科学研究“第四范式”方兴为艾。在“信息泛滥、知识匮乏”的背景下,科研人员面对日益复杂的科研问题,对个性化、关联化、集成化精品信息资源,以及嵌入科研过程的深层次知识服务需求更为迫切。通过引入关联数据的理念和方法,本文基于国家农业图书馆和农业科学数据共享平台中各类数据资源,开展了农业科技多维语义关联数据构建方法和关键技术研究,并选取“水稻”领域进行实证研究,设计并实现基于关联数据驱动的领域知识服务原型系统。开展的主要工作及取得成果包括:(1)调研了国内外最新研究进展,分析了关联数据与数据网络、语义网和知识组织系统等概念的区别与联系,对关联数据进行了分类,深入调研了关联数据的构建流程、语义关联描述模型、构建工具和关联关系构建方法。(2)应用简单知识组织系统SKOS,将农业科学叙词表CAT进行了规范语义描述,并与AGROVOC、NALT等几大涉农知识组织体系建立了映射,自主开发了批量转换工具将CAT转换为CAT/SKOS关联数据。(3)在深入分析国家农业图书馆科技文献资源特点基础上,综合应用DCMI、BIBO等本体,对其进行了规范化描述和语义关联模型构建,自主开发了文献自动标引工具,将CAT/SKOS规范概念植入各类文献,基于开源工具D2R实现了农业科技文献语义关联数据构建。(4)继承复用SWRC、VIVO、FOAF等本体,将农业科学数据共享中心700多个数据库集,以及农业科技机构、科技人员和科研项目等专题数据库进行了规范化语义描述,构建了覆盖科学数据、科技文献和叙词表的多维语义关联模型,构建了轻量级的农业科技多维语义关联数据网络,创建RDF三元组超过300万个。(5)设计了关联数据驱动的领域知识服务系统体系架构和功能模块,通过集成SPARQL、Virtuoso等关键技术,开发了水稻领域知识服务原型系统,实现了领域知识的集成浏览和关联发现、动态分面导航与检索、SPARQL终端查询、HTTP URI参引解析和RDF内容下载等功能。研究表明,引入关联数据的理念和技术方法,是实现海量农业科技信息资源精细化揭示、规范化描述、语义化组织和深度整合的最佳实践,对提高农业信息资源的可知性、可见性、可获得性将起到重要作用。基于关联数据来设计和开发新型知识服务功能,可进一步拓展知识服务途径,对促进农业科研创新有着重要研究价值和实践意义。本文在农业科技多维语义关联模型和关联数据驱动的领域知识服务系统构建方面都具有一定创新性。