论文部分内容阅读
随着大数据技术的发展,开放数据也开辟出了新的道路,开放政府数据建设成为世界各国政府透明化建设中的重要一环。通过开放政府数据,挖掘政府数据能量与价值,发挥开放政府数据应有的潜能,是开放政府数据研究者们的目标。但在开放政府数据应用研究中发现,政府数据在不同系统的开放过程中互操作水平不一,开放政府数据质量参差不齐,造成开放政府数据的实际可利用程度并不高,同时由于数据在多个系统中流转处理之后,数据的原始面貌更难以窥见,极大地限制了开放政府数据的重用能力。因此,本文从开放政府数据的全生命周期角度出发,研究开放政府数据中的每一个环节,并因此建立数据溯源模型,利用统一的元数据表达映射到统一的溯源模型中,提高开放政府数据的互操作能力,也可以再现开放政府数据变化过程,促进开放政府数据重用。本文的工作包括:(1)调研国内外优秀开放政府数据实践,收集数据相关的生命周期模型,分析其特点和应用环境,阐述生命周期理论的应用价值与意义,提出开放政府数据领域生命周期模型。(2)介绍和分析W3C数据溯源模型以及我国信息技术数据溯源模型,提取元数据中的溯源信息和我国地方政府数据平台中的溯源元数据,建立元数据与PROV溯源之间的模式映射。(3)根据开放政府数据的领域特点,建立开放政府数据领域的溯源模型,并运用其设计思想,建立了开放政府数据领域的组织本体和软件工具本体。(4)应用开放政府数据溯源模型,关注开放政府数据发布和重用过程的溯源,以Turtle语法进行溯源编码,进而通过SPARQL查询有效的溯源信息,以便于对开放政府数据进行质量溯源管理。我国关于开放政府数据的溯源研究还处于分析借鉴阶段,关于溯源模型的应用创新研究也有待深入,本文在建立数据溯源模型时力求周全,以使该模型能够适应更大范围的应用,但是对于开放政府数据建设来说,应用数据溯源将为开放政府数据带来积极的影响。