论文部分内容阅读
随着社会信息化进程的日益加速,现有通信、金融等领域内的业务数据也在不间断的更新完善,数据量呈爆炸式增长,计算机存储系统的数据已达到PB量级,这些数据以记录或者文件的形式存储在企业的存储系统中,随着时间的推移,数据的利用价值也在变化,必然在存储系统内部会产生大量的不常用的数据,这些数据占据了存储系统的大量有效存储空间。面对日益增长的数据量,大多数企业想到的是在原有存储系统的基础上扩充容量,但是在容量扩充到一定程度后很难继续在原有存储系统上增加容量,等到原有存储系统的容量不能在容纳更多的数据,企业不得不花费高成本新增加一套跟现有存储系统同样级别的存储系统,从表面上看增加了一套新的存储系统解决了存储容量扩充的问题,但是,在大数据量的存储系统磁盘I/0成为数据检索速度的主要瓶颈,这样做不但不能提高检索的速度反而在整体上降低了存储系统的性能;这样就造成企业在数据处理时效率低、企业客户访问速度慢等一系列的问题,如何解决规模庞大的记录形式的数据存储,提高存储系统中所有存储资源的利用率,解决传统存储在I/0和存储容量的瓶颈问题,分级存储有着重要的意义。该论文首先介绍了分级存储结构及其必要性和优势所在,分级存储的国内外研究现状和在实际应用中存在的问题,接着综述与分级存储理论息息相关的信息生命周期理论。分析了现有四种基本的数据存储结构及各自的特点,详细概述了目前典型的三级存储架构,以及每级存储架构的特点。该论文对基本数据存储结构及分级存储架构分析后,接着分析了先进先出、最优置换算法、最近最久未使用、第二次机会等常见的数据置换算法基本思想,在分析各算法的各自特点后对比个算法的优劣之处,作为现行典型数据分级算法的原型,在此基础上引出对几种典型数据迁移策略的分析,分析了基于存储空间的高低水位法、基于访问频度的CACHE置换算法和基于生命周期的价值评估法,分析对比三种算法的优劣。通过分析通信、金融两种典型行业应用系统数据库存储特点,指出两种行业中存在的若干问题,接着分析了传统分级存储思想下的存储级别划分,最后给出银行业务系统存储级别划分方案及记录形式数据分级存储系统设计。该论文提出一种基于综合频度指标的数据分级存储方法,该算法综合考虑了存储设备的存储空间、存储设备性能、数据的相关性等因素,试图通过平衡各个影响因素对数据访问的影响,以达到数据最理想的访问效果,算法在Windows平台下模拟试验证明,与两种典型算法相比,该算法在实现数据分级以及平衡存储系统容量和访问速度方面更高效。