基于ODS的数据仓库与挖掘及其在钢铁企业中的应用

来源 :辽宁科技大学 | 被引量 : 0次 | 上传用户:jingkaiqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术发展的浪潮使人们进入到了信息爆炸的时代,海量信息需要人们去处理与应用。数据处理已经不是信息技术的重点,代之而来的是如何充分使用这些信息。现在众多的企业都进行着信息化建设,随着企业信息化的不断深入,人们对企业数据进行整合与分析的需求也更加强烈,也越来越重视企业统一的数据仓库平台建设。因此如何建立高效的、企业级的数据仓库决定着企业信息化的成效。数据挖掘技术是20世纪90年代迅速发展起来的技术,能从企业的“数据海洋”中挖掘出有效的、具有潜在效用的规律或模式。利用数据仓库进行数据挖掘可以提高企业经营决策的正确性,大大提高企业的经济效益。 本文对数据仓库的建设与数据挖掘的技术进行了深入研究,并在某钢铁企业具体实现了建立数据仓库的步骤、挖掘出有益的结论。我们实现了建立数据仓库的一个完整循环,为钢铁企业甚至别的行业建立数据仓库提供了宝贵的经验。钢铁企业的生产具有连续性、业务逻辑复杂、数据量大等特点,对数据分析的实时性要求也比较高;针对这种具体的企业特点与需求,提出了建立具有ODS层的数据仓库体系架构。数据仓库的建设中,数据质量是关键的问题,为此我们将传统的ETL三个步骤扩展为ECCD四个步骤,为提供高质量的数据打下了坚实的基础。在详细分析了数据仓库ETL的构建过程、数据清洗的原理及其设计要点的基础上实现了从数据源系统中抽取数据、经过清洗、整合处理,最后加载到数据仓库中的完整过程。在对数据挖掘的现状与功能的分析的基础上,总结了数据挖掘需重点开展的工作。并利用K-means聚类算法对客户进行了聚类分析,为企业的营销提供了技术支持,并带来了巨大的经济效益。
其他文献
本论文主要研究了图的judicious划分问题及平衡judicious划分问题.研究主要基于Bollobás和Scott提出的一个问题:是否任何有m条边的图G都存在顶点集V(G)的一个k-划分V1,…,Vk,
本文简要阐述了当下计算机审计在政府投资中的现状,分析了当下其展现出来的问题,并提出了几点解决建议。
在会计领域中采取计算机数据处理技术,不仅可以转变传统手工操作的方式,同时也可以有效提高会计工作的效果。通过对比可以看出,会计信息化系统能够高效完成企业中的财务管理
在新会计制度的推进与实施下,对企事业单位的财务管理模式产生了重大的影响,使其面临着一定的机遇与挑战,促使其改善原有的财务管理模式。而财务管理是企事业经营管理中一项
马氏链作为描述一类实际问题的数学模型,在经济学、生命科学、随机服务系统、计算科学、随机分形等邻域中取得了极为丰硕的成果.近几十年来,人们对非齐次马氏链的极限定理和遍历
利用子群的性质去研究有限群的结构是人们一直关注的问题.本文主要运用子群的弱c-正规性来刻画有限群的结构.称有限群G的子群H在G中弱c-正规,如果存在G的一个次正规子群K,使得G=H
随着社会经济的快速发展,现代工业的数量和规模在不断扩大,产品的质量和科技含量不断提高,但受到企业经营水平、管理能力等方面的影响,工业企业的管理水平还相对较低,企业尚
"58号文"后满足特定条件的甲供工程必须适用简易计税方法。政策变化带来计税方式的调整对房地产开发公司和建筑安装企业的影响分析以及应对措施建议。
本文主要研究了一类脉冲时滞神经网络、脉冲时滞细胞神经网络和脉冲时滞Cohen-Grossberg神经网络的稳定性。主要内容如下: 首先,介绍了脉冲微分方程的基本概念,包括Lyapunov
粗糙集模型是由数学家Pawlak首先提出的一种用于处理模糊和不确定性知识的新型数学工具,已经在机器学习、知识获取、决策分析、专家系统和模式识别等领域取得了一些成功的应用