联机分析处理和可视化技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:shanon0577
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以数据仓库、联机分析处理和数据挖掘技术为研究背景,从提高数据仓库和OLAP系统性能的角度出发,研究了实物化视图技术.以数据的展现为要求,设计与实现了OLAP多维分析中的数据的展现,并运用可视化技术设计与实现了数据挖掘中决策树的可视化.实物化视图技术是一种常用和有效的提高数据仓库中数据访问速度的技术,该文综合阐述了实物化视图技术的目的和分类,介绍了能描述数据立方体视图间依赖关系的依赖格,通过这种依赖格可用静态选择算法进行实物化视图选择.还介绍了静态实物化视图选择算法中著名的贪心算法,通过分析该算法复杂度高的原因,综合考虑各种因素,对算法进行了改进,提出了一种新的收益模型.该文还讨论了视图集的化简技术,通过与实际的查询集相关联,大大减少视图选择算法中需要计算的视图的个数,降低了算法的复杂度,提高算法的性能.另外综合运用提到的技术,提出了一种数据仓库系统中实物化视图系统的框架设计.复杂的数据立方体在展现上缺乏直观性,尤其当维度超出三维后,数据的表示就比较困难.该文提出了一种多维数据用二维表格形式展现的方法,将数据立方体中的维都划分到行维或列维两种维度中去,在二维表格的固定行和固定列中用树型结构体现维的层次结构和层次关系,在行维和列维交织成的二维表格中显示相应的度量数据,实现以二维表格反映多维特征,提供数据立方体的可视化表示,并在此之上进行多维分析操作.此方法并不在程序中保存一个树型的结构,而是通过对树型固定行对象和树型固定列对象中相邻单元格的层号和可见属性的计算,设置相应的可见属性,再通过单元格自身的绘制方法来画出树型结构,这种方法具有复杂度低,运算量小等优点.此外在考虑大数据量时,查询性能可能产生的问题,采用动态填充技术,在不影响用户观察数据的情况下,大大提高了数据查询速度,使用户能直观、快速的得到数据.数据挖掘中决策树是一种重要的技术,可以用于分析数据和做出预测.该文介绍了一种树的画法,通过能反映树结构的二维数组,按从下向上,从左至右的顺序对树进行遍历,在遍历的过程中进行结点的水平调整,亲兄弟与父结点间位置的调整,最后画出一棵符合美观要求的树,此算法结构简单、复杂度低.在此基础上,采用可视化技术中的各种方法,添加能反映决策树中各种信息的表示,将决策的知识可视化的展现在用户面前,能够很好地帮助用户理解采掘出来的知识.
其他文献
网络管理的提出是为了在网络规模不断壮大、网络设备越来越多样化的条件下保证计算机网络安全、稳定的运行。当今世界上有三种网络管理框架,分别为电信管理网TMN(Telecommunic
我们结合北京朝批商贸有限公司的管理信息系统,设计并实现了一个适合国内商业领域的B2B商务平台EDI-CP.在EDI-CP的基础上,又设计面向服务的数据交换平台EDI-MQ, EDI-MQ提供了
该文首先对关联规则的挖掘的基本理论和方法进行了详细的阐述,并在此基础上,对经典的关联规则的挖掘算法进行了改进,从而提高了关联规则挖掘的性能.该文的工作主要包括以下内
本文详细研究了数字图像处理技术在工程图纸集成处理系统的图纸预处理模块中的应用,利用灰度的线性变换与灰度拉伸解决了图纸的过明、过暗及明暗不均问题;对图纸噪声及背景的类
目前盛行的网络应用是客户机/服务器(Client/Server,简称C/S)模式,这种模式虽然有利于网络的集中控制,但同时也制约着网络的广度和深度的发展.随着分布式计算技术的快速发展
现代服务业是指在工业化比较发达的阶段产生的、依托信息技术和现代管理理念发展起来的、信息和知识相对密集的服务业,包括由传统服务业通过技术改造升级和经营模式更新而形成
客户关系管理(CRM—Customer Relationship Management)是适应现代管理思想发展起来的一种新型管理模式,可以分为协作型、操作型、分析型三种类型或三个部分,分别实现接入管理
生产数据一直是工业企业最关心的信息。过去,这些数据信息只能记录和显示在车间控制室。随着网络的普及和发展,各企业都拥有自己的Intranet,这为发展工业生产数据监测系统提
随着Internet的发展,人们对网络信息安全的要求越来越高。在网络信息安全系统中,防火墙作为常用的网络防护方式在保障网络的安全访问方面具有重要的作用。防火墙需要人为的进行
本文的主要内容是关于一个基于三层C/S结构的自来水水费MIS系统的分析、设计和实现的具体过程及技术实现细节。 我们在认真分析了自来水行业普遍的业务流程以及苏州吴中自