论文部分内容阅读
三峡库区地质灾害预警指挥系统(GHPACS)数据仓库的建立,将GHPACS中各系统各自为政的操作型数据进行面向分析的整合,形成一个集成的一致的数据中心,直接为预警指挥系统预测预报及决策分析服务。GHPACS数据仓库的数据来源于地形地貌、地质、水文地质、工程地质、地震、地质灾害、监测预警、地质灾害勘察、治理工程、气象、人文经济以及国家政策法规等多个专业和领域,一般用户或某个领域的专家理解起来将面临不少困难。数据仓库元数据为数据仓库系统提供一张完整的数据地图,包括数据的内容和位置、数据抽取和转化规则等,被认为是数据仓库的核心。因此,元数据建设对于数据仓库的设计、建设、维护和应用等各个环节来说,都有着非常重要的意义。
数据仓库在商业领域有着无数成功的案例,国内外很多专家和学者对数据仓库及其元数据进行了大量的研究,数据仓库相关技术是继互联网之后的又一大热门话题。关于数据仓库元数据,大家关注最多的是数据仓库与各个应用子系统之间的元数据集成。元数据联盟(MDC)和对象管理组织(OMG)分别制定了开放信息模型(OIM)和公共仓库元模型(CWM)两个数据仓库元数据标准,旨在为数据仓库和各个应用子系统提供了一致的元数据描述。这两个标准对元数据管理和共享意义非凡,但同时大大增加了用户学习和理解元数据的难度(比如,CWM共有280多个表,表之间的关系错综复杂),这与元数据的基本意义是相悖的。元数据的最基本意义可以理解为连接数据到信息(或知识)之间的桥梁,因此元数据的可读性应该是首要考虑的问题。特别是当数据仓库首次被应用于综合灾害预警指挥领域,其源数据不同于商业数据和传统的空间数据,一般的元数据标准难以满足地灾预警领域的用户和数据的要求。如何架起地灾数据到预警知识之间的桥梁,是本系统元数据的使命。
本文阐述了元数据的意义和基本表现,分析了GHPACS数据仓库系统的体系架构,并对GHPACS数据仓库元数据的研究对象进行界定。在此基础上,以面向用户为出发点,分析GHPACS数据仓库体系结构和源数据的特点,设计一套简洁GHPACS数据仓库元数据模型。根据模型规定的内容,分析元数据的信息来源和获取方法,指导元数据库建设。分析对应的元数据管理与发布平台的建设原则和基本需求,从功能和技术两个方面进行设计。意在提高元数据获取的效率,并以合适的方式发布元数据。本文弱化元数据系统论,更多地从数据的特点和用户需求两个方面来考虑元数据模型的设计。重点突出元数据的可读性和实用性,目的是让用户更好的理解元数据进而理解数据。此举有利于让地灾数据转化为灾害稳定性评价等专业所需的知识,为更快更准确的灾害预警指挥服务。元数据的成功应用,将有利于数据仓库技术在更多行业推广。