基于数据仓库技术多元统计分析的研究与应用

来源 :东华大学 | 被引量 : 1次 | 上传用户:xin__yonghu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计分析软件包的研究与应用起于上世纪70年代,目前国际上知名的统计软件包有SPSS(Statistical Package for the Social Science)和SAS(Statistic AnalysisSystem)等。尽管国内在这方面的研究与应用起步较早,但系统地研究和实现结合当前网络和多系统计算环境的通用统计软件包则鲜有报道。随着网络经济和信息化技术发展,越来越多的企事业单位已不仅仅满足通过计算机应用系统对业务的自动化管理,开始关注对已有业务数据的分析,希望基此发现数据中隐藏的内在联系、潜在规律和趋势,以有效支持企事业单位关于管理、生产研发、转型、经营和销售等的决策。本文作者在参与研究和分析当前主流统计软件包,以及基于数据仓库技术实现多元统计分析软件的可行性及其相关技术特点的基础上,参与了适合当前网络和多系统计算环境的通用统计软件包原型系统的研制。该系统基于三层构架模式实现,能够根据预设参数和分析模型自动抽取生产环境数据源的数据,并经转换后装载到数据仓库,同时兼有跨平台数据集市的应用功能,并提供多种描述量统计和多元统计分析的功能。本文作者在本项目中的主要研究工作有:1)参与适合交互式统计软件包的三层体系结构的设计与实现;2)研究适合交互式统计软件包的多元统计模型,包括理论、方法、算法和人机交互界面;3)基于数据分析模型,参与研究和实现将数据从生产环境的中央计算机系统经抽取,转换和存储到数据仓库中的实现方法及其数据存储组织结构;4)根据分析和预测的需要,定义星型数据模型中的维表和事实表的结构,支持多维数据模型的OLAP分析;5)以XML格式文件定义层间请求与反馈的接口协议;6)给出时间序列分析在轨道交通客流预报中的完整的技术解决方案。
其他文献
近年来,随着计算机计算速度和能力的大幅提高,传统的加密技术已经不能满足当代网络通信安全性的需求。由于混沌具有一系列较好的特性,如对初始条件和控制参数的极端敏感性,伪随机
基于背包问题的公钥密码算法是密码学历史上最早被设计出来的几个公钥密码算法之一。由于背包密码的快速加解密优势和背包问题是NP完全问题,很长一段时间内背包算法受到普遍
数字水印技术是信息隐藏技术的重要研究方向,它在数字图像等多媒体版权保护以及内容认证方面具有重要价值。互联网的便捷性和数字媒体复制的低成本,在促进数字产品在现实中的
程序是用计算机程序设计语言编写的用于实现某种操作的指令集合,程序为了对抗逆向分析或者是代码窃取,通常会采取一些自我保护技术,程序行为或者代码隐藏技术属于其中的一种。程
任何一门学科的快速发展都离不开社会需求的支持和推动,随着人们对生活质量和健康水平的日益重视,医学已经成为本世纪发展得最快的学科之一。在医学迅猛发展的过程中积累了大
随着海量数据的急剧增长,数据的有效处理和计算成为目前亟待解决的问题。目前,由传统的机构结构化数据发展到大量半结构化、非结构化数据,这种趋势给传统的数据处理工具带来了很
加强对高压电缆的实时状态监控是确保高压电正常工作的重要环节,随着我国电力的高速发展,对电缆电压进行有效的在线监测手段将成为迫切需求,社会各界给予了极大的关注,并在多
随着计算机网络的发展,数字媒体的传播越来越方便快捷,然而由此引发的版权问题也日益尖锐,数字水印作为一种解决数字版权问题的有效手段,正越来越受重视。而随着新的需求逐渐展现
随着话题检测、社区发现、垂直搜索引擎等Blog研究的展开,对于结构化Blog数据的渴求也日益强烈,然而传统Web信息抽取在丰富灵活多变的Blog数据源中遇到了很大挑战,因此专门针
伴随着Web2.0技术的发展,作为一种典型的用户创建内容的应用,网络论坛在全世界非常流行。每天有无数个针对能够想象到的所有话题或问题的页面被互联网用户创建,因此论坛数据