轻量级动态数据仓库的研究和应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:bach88888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据库应用系统中,加快数据查询的执行速度非常重要。数据仓库技术通过对源数据库的数据提前进行归纳、分析、整理,从而提高了查询速度。动态数据仓库针对传统数据仓库更新周期长,只支持历史数据等缺点进行改进,可以直接获取数据,实现秒级别更新,从而可以应用到实时报表的生成功能中。但是动态数据仓库的成本较高,很多中小企业无法承受。为了节约成本,在事务数据库中利用物化视图技术,将查询进行预处理并将结果保存到事务数据库中,可以模拟动态数据仓库的效果,但实际中受到空间、时间的限制,不可能将所有视图物化,所以必须选择一部分视图进行物化,而且随着查询集的变化,物化视图集也需要调整,本文正是基于这一问题提出改进动态物化视图选择算法,设计轻量级动态数据仓库来解决事务数据库中生成报表慢的难点。主要工作如下:   1.深入分析了物化视图选择问题的基本研究方法,并对此问题进行了形式化描述;仔细分析了现有的经典算法,并且对比分析了这些算法各自的优缺点,为我们提出改进算法奠定了基础。   2.提出了改进动态物化视图选择算法,吸收了即时动态调整算法和批量更新算法的优点,并提出了查询时间和用户体验结合的综合指标,并增加了权重系数,为重要视图或重要用户提供更高的权重,从而整体提高整个系统的性能或某个重要用户的体验,还引入衰减因子使得历史查询数据对当前决定能有合适的作用。   3.结合某跨国金融公司的开发实例,将本文提出的改进动态物化视图选择算法应用其中,设计轻量级动态数据仓库来解决报表生成慢的问题,实验证明查询性能有明显的提升。
其他文献
片式结构(Tile)多核处理器以其良好的可扩展性和低能耗性已经成为一种重要的多核架构。数据流编程(Data Flow Programming)作为一种开发并行性的有效方法已经被广泛应用于多核处
ZigBee无线传感器网络作为一种新型短距离通信技术,具有短距离、低速率、低时延、低功耗、低成本、安全可靠、大容量的特点,最有可能实现“无所不在的网络”理念。它不仅在工
随着虚拟化技术和云计算技术的发展,越来越多的科学计算应用运行在云计算资源之上。MPI编程模型是一种消息传递编程模型,大多数科学计算应用都是基于这种消息传递编程模型的高
服务器是信息服务业的基础设施,但当前利用率普遍偏低。虚拟化技术能够提升服务器效率,降低管理复杂程度,在数据中心得到广泛运用。块设备是存储I/O系统中的主要外部设备,其访问
重复数据删除作为当前存储系统的关键技术,能够大幅节省存储空间,极大减少网络数据传输量,尤其是针对数据备份和归档。然而,当面对大量数据时,数据块指纹索引不能全部放入内存,磁盘
特征选择是一种用来降低数据集维度的技术,其核心是从输入的特征集合中选择出最具有预测性的特征子集来代表原始数据集合。特征选择不仅可以简化特征内在的关系还可以改善整
随着网络安全问题的日益突出,隐蔽信道作为重要的网络危害之一,逐渐成为学术研究热点。根据隐蔽信息的载体的不同,隐蔽信道分为时间式和存储式隐蔽信道,另外还有多链路式隐蔽
互联网技术的快速发展致使涌现出了各种类型的数据资源,用户面对的信息结构与层次难以划分,信息的有效组织成为一个亟待解决的问题。目前主流文件系统主要是解决数据的存放的性
随着我国高校的蓬勃发展,高校教学和课程改革也全面开展,课程考核与分析决策是实现改革重要形式,如何降低课程考核的工作量,如何做到课程考核的全面性、科学性,提高课程考核
随着多媒体技术及因特网的快速发展,因特网上图像数据来源不断扩大,图像的数量增长迅速。相对于文字信息,图像表达更加生动、易于理解,因此各行各业对图像的使用越来越普及,比如医