原生XML数据仓库模型研究与应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:wfn031641lpp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据仓库技术的发展,数据组织越来越复杂,数据源也越来越多样化,传统的数据仓库已经不能很好地适应新的要求。XML是一种可扩展的标记语言,具有可扩展性、结构性、平台独立性、自描述性、灵活性、规范、简单性等优点。XML具有上述的优点,因此,把XML和数据仓库结合起来,构造原生XML数据仓库就能很好地解决传统数据仓库遇到的问题。本文以此为背景,对原生XML数据仓库进行研究探索,提出了基于模式树的XML数据预处理模型和XML多维数据模型,为决策支持提供了良好的数据基础。本文首先阐述了数据仓库的产生和发展,介绍了数据仓库和XML的关键技术,包括数据仓库的体系结构、OLAP相关理论、多维数据模型及DTD,XML Schema等技术。随后提出了基于模式树的XML数据预处理模型——XETL,从数据模型和谓词模式研究XETL模型,然后基于XETL模型定义并实现ETL过程中属性选择、空置处理、聚合以及属性重命名四类主要的转换处理操作。接着,研究XML数据仓库的存储标准,提出了原生XML数据仓库的语义定义从而建立原生XML数据仓库多维模型,并证明原生XML数据仓库多维模型的完备性和有效性。最后,在该数据立方体上实现了各种OLAP操作,初步完成了原生XML数据仓库系统。这种数据仓库的实现方案,保证了数据仓库系统的稳定性、灵活性和可扩展性,适应了新一代WEB应用的需要。
其他文献
弹性分组环(Resilient Packet Ring)做为一种新兴的城域网传输技术,和MPLS并称为城域网传输技术的两个奇葩,实现了城域网、大型专网建设的一个技术上的革新,为用户提供高质量
计算机视觉和机器智能的一个主要目标就是对形状进行灵活有效的描述。一个表示形状结构的重要方法,就是对物体的骨架化。骨架化是包含物体拓扑结构特征的压缩表示,它在形状匹
Peer to Peer即对等计算或对等网络,通常简称P2P,可以简单地定义成通过直接交换来共享计算机资源和服务。通常这些资源和服务包括:信息的共享与交换、计算资源、存储资源等。
随着互联网上数据量爆炸式的增长,搜索引擎技术得到广泛的研究,并且出现了一批非常优秀的搜索引擎。但是,现有的搜索引擎只是将返回结果简单地进行线性排列,用户想要的信息可
学位
分类作为数据挖掘领域中最为活跃的分支之一,被广泛的应用于模式识别、图像识别、机器学习等领域。而且,分类在现实社会生活、生产实践中也有着广泛的应用场景,比如医疗图像
随着互联网及相关技术的发展,越来越多的人通过网络进行信息互通、知识传播和文化交流。网络学习(E-Learning)也逐渐成为人们获取知识的重要方式。E-Learning是指通过Interne
数字图像配准是计算机视觉中的一个基本问题,它在三维图像重构、目标识别、对象分类、相机自校正等方面都有广泛的应用。数字图像配准通常是数字图像处理的一个预处理阶段,比
随着光纤保护系统在通信领域的广泛运用,建立一整套软、硬齐全的光层保护监控系统尤其重要。此种系统不仅可以实时监控光线路状态,对各种现象给予及时处理,还可以很好的管理
语义分析作为现阶段自然语言处理研究领域一个重要的研究课题,近年来备受关注。然而由于目前准确、深入的自动语义分析技术发展受到限制,在一定程度上遏制了自然语言处理技术