MDA方法在ETL技术中的研究与应用

来源 :大连交通大学 | 被引量 : 0次 | 上传用户:lvtao_cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息是企业最重要的资源之一,是企业运用科学管理、决策分析的基础。传统的面向事务处理的业务系统,在积累数据信息的同时,对如何利用这些信息显得力不从心。数据仓库系统是在业务系统的基础上发展而来,旨在帮助用户充分利用宝贵的信息资源,做出正确的决策。在数据仓库系统各个组成部分中,ETL的执行效率是影响数据仓库系统成败与否的关键所在,ETL的开发也是整个数据仓库系统开发过程中工作量最大、耗时最长的部分。然而,目前存在的ETL工具中,存在着一些问题,最典型的是开发出的ETL工具固然强大,但在概念层上没能实现ETL与数据仓库其他部件融合。针对这个问题,本文提出了把MDA(Model Driven Architecture)方法运用于ETL部件的设计和开发的思想。本文将MDA的开发方法应用到ETL过程,首先提出了基于MDA的数据仓库开发框架。接着借助于UML profile和CWM(Common Warehouse Metamodel),分别对ETL过程进行PIM(Platform Independent Model)和PSM(Platform Specific Model)建模,并且使用形式化方法——QVT(Query/View/ Transformation)规范中的Relation语言定义ETL的PIM和PSM之间的转换规则。通过支持QVT2.0的开源工具MediniQVT实现PIM模型到PSM模型的自动转换。并在IBM所提出的EMF(Eclipse Modeling Framework)下实现了PSM模型到SQL的转换,从而实现了以模型为基础的模型驱动开发过程。使得ETL的建模较早的地伴随数据仓库系统进入设计阶段,减少开发的时间和代价。最后对某钢铁企业订单销售数据完成了数据的抽取、转换和加载。实践表明,利用此方法开发的系统不但在开发效率上较传统的过程开发方法提高了,从而使模型更加具有规范性,可以很好地实现不同模型之间的共享,同时,也有利于模型的重用和维护。
其他文献
由于网络技术发展迅速,不管是在什么时间什么地点全部能够接收到所需要的信息时现在人类的基本要求,这就是移动计算技术产生的原因。由于移动计算的环境以及固定计算的环境的
随着地铁监控系统集成和互联专业的多样化,其信息模型也越来越复杂。基于关系模型的实时数据库在描述监控系统复杂对象时显得无能为力,而且对适应不断演化的客观系统缺乏灵活
当今,传统测验越来越不能满足社会的需求,因为它只能提供给被试一个笼统的分数或能力,对于考生具体的知识状态无法获知。与传统测验相比,认知诊断测验的优势就在于它能够揭示每个
随着后信息时代的来临,人们对空间信息服务的获取速度、高清分辨率、海量资源提出了更高的需求,G/S模式(Geo-Information Browser)和空间信息服务器(Spatial Information Ser
指纹具有唯一性、可靠性和稳定性的特征,在身份鉴别认证领域得到了广泛的应用,其商业应用也越来越成熟。从指纹图像中提取高质量的指纹模板,并且实现高识别率和鲁棒性的基于
信息技术的发展,为虚拟水稻的研究提供了新的方法和手段,利用计算机系统、结合水稻的生理生态过程可以模拟出符合水稻生长规律的具有机理性、更真实的虚拟水稻。   本文在研
学位
随着网络技术的不断发展,Web应用系统扮演的角色越来越重要。基于B/S结构的Web应用程序也成为Internet上使用最为广泛的应用开发技术。在Web技术发展的过程中逐渐产生了大量
人类视觉系统能够轻易地辨认各种物体,然而对计算机来说这并非一件容易的事。作为计算机视觉领域中一个研究的热点和难点,图像分类和识别问题长期以来受到了众多学者关注,具
随着人类社会的进步和计算机网络技术的发展,数据信息与物质和能量并列成为世界三大资源。在现今信息爆炸的时代,为了从大规模数据中提取关键信息,迫切需要高效的查询处理技术。
在定义特征以及进行模型构建时,语义特征造型系统是采用完全语义约束的。这种方式可以比较全面地满足工程设计人员的意图,但是,与以往基于参数基于历程的特征造型相比,它更为