论文部分内容阅读
Internet技术的飞速发展促使信息迅速膨胀,对信息资源管理和共享的需求亦变得越发迫切,使得已经在传统领域内趋于成熟的数据库技术,面临着许多新的问题和挑战。
在加入世界贸易组织以后,我国农业在国际竞争中一直处于不利的地位。随着农业信息化建设的逐步深入,农业各领域业务支撑系统的不断建设和完善,迫切需要将这些分散独立的业务系统数据进行统一整合,为领导层规划发展方向、制定相关政策等提供可靠的数据保障。
元数据在数据仓库系统中地位是十分重要的,元数据库中存放着许多重要的信息,尤其是对于数据仓库的ETL过程,元数据是ETL的指挥中心,是将分散的数据源集成在一起的“粘合剂”。
不同厂商生产的大多数产品拥有不同的元数据模型(即元模型,Metamodel),并使用其专用的接口发布元数据,集成这些软件产品、工具和应用程序,需要一种单一的、业界范围的元数据交换标准。CWM(Common Warehouse Metamodel,公共仓库元模型)正是一个被OMG采纳的在数据仓库和业务分析环境中进行元数据交换的标准,并且被业界普遍认可。
本文针对农业数据多源异构,特别是多业务的特点,提出了基于数据仓库法的数据集成体系架构,给出了基于元模型的数据集成方法,并以CWM模型为基础,根据具体的农业数据集成需求,对CWM模型进行了必要的选择和适当的扩展,构建了数据交换、数据集成、业务逻辑三个元模型,实现了系统快速建模。通过构建的元数据模型,控制数据仓库数据集成的ETL全过程。本文针对异构数据集成中语义集成的难点,定义的数据集成元模型构建了统一全局模式,最终将异构、多业务数据整合到统一平台中。接下来,本文分别对三个元模型的构建作了详细描述与介绍,重点研究了三个元模型控制ETL流程的方法,最后实现了基于元模型的关键指标分析系统。
本论文课题来源于上海市重点攻关项目《信息技术在农业生产、管理和经营中的应用》中的子课题《上海农业综合数据库的开发和应用》。