数据仓库及商务智能实施过程研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:LittleCam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文为作者在企业博士后期间一些主要研究工作的报告,主要为数据仓库和商务智能项目过程研究方面的内容.商务智能已经成为企业创造更多盈利的关键,商务智能将是下一个热点,数据仓库和BI项目实施前景广阔.但商务智能项目实施成本很高,容易失败,商务智能的实施需要高效的过程支持.本报告首先介绍了数据仓库和商务智能领域的一些基本概念,讨论了数据仓库和商务智能项目过程的一些构建原则,提出一种数据仓库过程动态模型,定义了过程的元模型及主要概念.该模型中将工程流程分为技术体系构建和分析应用开发两个平行又相互独立的部份,强调开始初期构造原型的重要性.该模型采用线型模式和迭代模式结合的开发模式.该模型能够涵盖大部分数据仓库项目的开发流程和活动.我们定义了核心流程和活动,定义了角色和工件.本报告也讨论了一些关键数据仓库设计问题.指出数据仓库的数据加载不仅是过程设计问题,而且在数据仓库的逻辑设计中就要设计相应的机制.通过一个实例讨论了数据仓库中的汇总星型模式设计方法,以及聚集过程在ETL工具PowerMart中的设计问题.数据挖掘(DM)是非常具有挑战性的工作,数据挖掘过程是多个因素耦合的决策问题.文中讨论了当前流行的DM过程CRISP-DM和SEMMA的不同之处及优缺点.本报告从机器学习、统计和数据质量角度对挖掘有效性作了讨论,认为一个真正高效的过程应该面向算法,强调探索,以挖掘出高可靠性的具有商业价值的知识目标,并紧跟技术的发展.本报告给出数据挖掘过程的多维视图,将算法分解为组件维、模型维和过程维等维度,以此提出新的DM过程的框架.数据挖掘应用中常涉及新算法的使用,本报告开发了一种数据挖掘新算法,本报告提出一种采用模糊划分处理连续变量的模糊朴素贝叶斯分类器,每个连续变量都有一个由模糊划分引导的有限模糊取值的集合.该方法采用梯度下降法去调整模糊划分集合的参数,文中验证了模糊朴素贝叶斯分类器的有效性和鲁棒性.
其他文献
随着Internet技术的广泛普及和应用推广,现代企业在功能和组织上对时间和空间分布有着较高的分布协作处理要求.采用Internet技术,研究和开发一种具有大范围时空协作处理能力
在现代社会中,人们需要一个信息平台来进行信息交流,正是基于这种需求,开发了基于COM+的电视发布信息平台系统,并在开发中采用了组件技术。 组件技术最基本的特征就是“即插即
随着人类对物质世界认识的不断深入,需要设计能量和精度更高的高能物理实验装置,由此将产生海量的数据,这些数据的存储和处理面临着巨大的挑战。自从互联网及WEB技术出现以来,人
该文对协同设计技术的若干问题开展研究.●研究了协同设计的公理化描述模型.●研究了协同集成设计环境的计算机辅助工具的协同用户界面和协同感知.按照以群体为中心的设计思
IPSec作为一种安全技术体系,极大地增强了网络通讯的安全性,而作为体系中重要组成部分的PF_KEY协议,使IKE守护进程能够方便地和内核中的安全关联数据库进行通讯。本文首先简要介
传统的网络管理系统是集中式模式,在现代的大规模复杂网络环境下难以满足网络管理的要求.目前的网络管理研究向分布式管理模式发展,该文在介绍了Web服务这种分布式对象技术的
几个世纪以来,信息逐渐在社会和经济的发展中发挥作用,但是进展缓慢。直到二十世纪六十年代中期科学家在电子和数学领域的发现促使了第一台计算机的面世,这一现象才得以改观。从
本文对软件可靠性工程在软件测试中的应用进行了研究。文章在对软件可靠性工程和软件测试等相关理论进行深入研究后,将软件可靠性工程与镇江海关口岸电子政务项目测试过程相结
随着网络规模的迅猛发展以及用户需求的膨胀,Internet已成为人们信息发布,娱乐和交流的媒体。尽管Internet提供大量的信息和搜索门户网站,但用户往往无法找到自己所需的内容。WE
本文对企业管理相关领域和软件工程方法进行了研究,并结合自身在企业信息系统开发过程中的实践,提出了以BPR和复用驱动的EIS开发方法。该开发方法的主要特色与创新点如下:1)在El