虚拟磁带库中重复数据删除技术的研究与设计

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:jiahongtao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球信息化的推进,我们的社会正在步入一个信息化的社会,政府机构以及各行各业都对信息资源、信息技术以及信息产业的依赖程度越来越大,对存储空间的需求也在飞速地增长。在进行数据备份时,会备份大量相同的数据和文件,而这些相同的数据和文件占据了大量昂贵的磁盘空间。VTL (Virtual Tape Library虚拟磁带库)以其备份性能高、故障率低、可靠性高等优势被广泛用于政府机构以及各行各业的数据存储中。因此,研究可以删除VTL中重复数据的技术是势在必行的。本文首先对虚拟磁带库和重复删除技术在国内外的现状进行了分析,找出了现有重复数据删除技术中存在的问题和不足,从而确立了本文的研究出发点。研究了重复数据删除的基本原理,然后通过以下几个过程:文件数据检测分块、块哈希值计算、块哈希值查找以及哈希值保存,实现了一个基于块级的重复数据删除系统。为了弥补重复数据删除中MD5哈希算法的“哈希冲突”问题,使用了拉链法对哈希算法进行了优化,增强了数据的安全性;为了提高系统检测重复数据块的效率,对基于内容的数据检测算法进行了改进;为了提高哈希表查找的效率,使用了Bloom Filter技术对哈希表进行了优化和改进。最后,在虚拟磁带库与备份软件的环境下对系统进行了测试与分析,从测试结果得出,改进的CDC数据检测算法比FSP和SB算法具有更高的重复删除率,重复删除系统比一般的数据压缩软件具有更高的数据缩减率。
其他文献
关键词查询的理论和技术在信息检索和Web搜索引擎中得到了广泛深入的研究和应用。传统数据库管理系统仅支持模式匹配,不支持自由形态的关键词查询。鉴于此,近年来关系数据库上
在国家的现代化建设中,桥梁建设是必不可少的。由于桥梁投资巨大、使用期漫长,因此其使用的安全性极为重要。为了实时了解桥梁结构在各阶段的运行状态,许多桥梁在建设时就安装了
电能作为当今社会最重要、最方便的能源,它支撑着整个国民经济体系和社会发展。如今,电力部门将提供良好的电能质量作为电力系统正常运行的重要任务,其中对谐波的管理、检测和治
随着现代计算机和网络技术的发展,物联网已经离人们的生活越来越近。虽然物联网可以给人们的生活和工作带来很多便利,但是随着之而来的安全和隐私问题也越来越严重,人们对于
随着IT技术的不断发展,人们对于宽带网络连接的需求也在不断增加,相比于传统的有线接入网络而言,无线P2P网络由于潜在的广泛应用能力在日常生活中扮演着越来越重要的角色。目前
脱机手写汉字有书写不清楚和不规范等特点,这给脱机手写汉字识别带来一定的困难。本文设计了一种基于组合特征和隐马尔科夫模型(HiddenMarkovmodels,HMM)分类器的脱机手写汉字
随着智能手机的不断发展,普通的消费者能够通过手机享受到更便捷的网络服务,而移动搜索也成为人们获取信息资源的主流方式之一。移动搜索本身有其自身的特点,由于智能手机在屏幕
随着传感器技术的日益普及和信息社会的快速发展,许多新兴应用领域中出现了实时连续、海量无限和快速变化的数据,这些数据以不同的更新速率连续地流进和流出计算机系统,学术界将
随着计算机网络技术和多媒体信息处理技术的迅速发展,我们能够越来越方便地创造、存储、编辑和传播数字多媒体信息。但是,技术发展的同时也带来了一系列信息安全问题,如多媒体信
无线传感器网络是一种新型的信息平台,它由在一个广阔的监测域内部署密集的传感器节点组织而成,这些节点具有价格低廉,自组织能力等特点。传感器节点将感知信息通过多跳路由的