数据仓库的数据析取技术研究与实现

来源 :华侨大学 | 被引量 : 0次 | 上传用户:baalzio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文描述了一个数据仓库通用数据析取软件的设计与实现。随着社会的进步和科技的发展,分析决策成为了各行各业的生命线。数据仓库技术凭借其在数据存储与组织结构上的优势为决策支持系统提供强有力的数据支持。本软件将来源数据经过集成、转换、清洗、优化后加载到数据仓库中,保障数据仓库拥有高质量的数据,为决策分析系统能有效地工作奠定基础。 本文第一章阐述本课题的意义并对数据仓库技术进行简要分析;二—六章介绍系统设计开发的思路和实现方法;最后一章进行总结和展望。 本软件采用了三层体系结构,使用COM技术和MTS开发和管理中间层组件。我们将数据的集成、转换、清洁、优化等模块都以COM组件形式进行了封装,形成.DLL文件,这样有利于系统的升级、维护和移植。 本文分析了形形色色的数据析取方法,将其归纳为集成、转换、清洁,并提出有必要对数据进行优化,如数据平滑、规范化等,以期更好地支持数据挖掘。 本软件支持对大部分结构化和半结构化数据的析取,包括各种关系数据库,Excel表格,有分隔符的文本文件,XML文件。特别是对XML文件的析取,是本软件特色之一。我们提出了一种基于规则驱动的XML模式数据到关系模式的转换方法,用于完成对XML数据的析取。 系统将用户定义的析取过程封装为析取包(Package),实现一次定义多次使用。为了提高析取包的执行效率,我们采用了微软的DTS作为传输工具,它大大加快了数据析取的速度。
其他文献
异构数据库集成是自80年代中期以来数据库界的研究热点。许多方法被提出,如数据库网关、ODBC等,以期解决集成系统所面临的异构性等问题。但是由于没有统一标准和构件化思想,使得
随着信息产业化的快速发展,数据的产生与收集能力迅速提高。存储数据的爆炸性增长业已激起对新技术和自动化工具的需求,以便帮助我们将海量数据转变成信息和知识。数据挖掘正是
随着国民经济的不断发展,人民生活水平的日益提高,汽车已经成为人们出行的重要交通工具;我国个人汽车的持有量在不断增加,大大提高了人们出行的便捷性,但随之而来的是交通事
随着市场经济的不断发展和电力系统规模的扩大,我国现行的电气设备定期维修已经不能满足电力系统经济、可靠运行的需要,有关状态维修的研究成为目前关注的热点。由于状态维修工作涉及大量的状态信息数据的管理和分析,单靠手工方式是难以实现的。因此,应用最新的计算机及网络技术,建立专用的状态维修支撑平台,对于推动状态维修在我国的实施具有重要的意义。 本论文重点探讨了反映状态维修思想的数字化管理体系,在此基础