基于重复数据检测的数据备份

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:guoshun9231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,信息数据已成为企业拥有的最有价值的财产,信息数据的丢失或损坏会给企业带来无法弥补的损失,数据备份无疑是最佳防范措施。随着企业的发展,需要备份的数据量呈爆炸性增长,如何高效的完成对海量数据的备份是一个急需解决的问题;数据备份中会产生大量的冗余数据,占据大量的磁盘空间。重复数据检测技术作为一项比较热门的技术,可以检测冗余数据,减少数据存储量,因此将重复数据检测技术和数据备份技术结合起来研究具有很高的实用价值。本文首先介绍了数据备份和重复数据检测的相关知识,针对传统重复数据检测算法无法识别文件重命名、路径变更的问题,本文提出基于NTFS文件系统的文件状态判断算法。重复数据检测算法一般采用基于数据块的哈希检测,这种方法实现简单但不能根据网络状况来调整数据块的大小,针对该问题本文提出一个根据网络状况动态的调整数据块大小的算法,将数据块划分为六个等级;在网络状况好时,重复数据检测的数据块要大一些;在网络状况不好时,数据块要小一些,这时产生的差异数据量较少,减轻网络传输的负担。该算法能够在网络传输和重复数据检测的计算开销之间找到一个平衡点。结合改进的重复数据检测技术和数据备份技术,本文提出基于重复数据检测的数据备份方案,备份系统主要包括重复数据检测模块、文件状态判断模块、数据备份模块、数据加密模块和配置管理模块等。基于重复数据检测的备份方案解决了三种常用备份方案的不足之处,减少数据备份中的数据冗余度,提高数据备份的效率。
其他文献
随着嵌入式软件的广泛应用,嵌入式软件的结构和开发技术日新月异,相对于硬件的日益稳定,软件故障却经常出现。为了保证软件的质量,需要对软件进行测试。由于嵌入式软件的自身
云计算作为一种新型的计算模式为计算、存储提供了一种新的解决方式。外包计算模型随着云计算的发展而因运而生,一个计算能力较弱的用户将复杂的计算外包到云服务器,云服务器
随着Internet的发展,越来越多的单点到多点的数据传输应用应运而生。组播比传统的单播和广播协议更适合这种一对多的数据传输。传统的组播虽然具有网络利用率高、能节省发送
车间作业调度是典型的NP难题。由于车间作业调度问题在组合优化方面的复杂性,直接影响着生产效率的提高和获取利润的大小,因此,车间作业调度的研究和应用,对于企业提高管理水
XML的全称是Extensible Markup Language(可扩展标识语言)由于具有简单、可扩展、互操作性强,开放性强等特点,正迅速成为一种与技术无关的数据交换的标准和传输格式,并逐渐成
随着网络技术的迅速发展和J2EE平台的广泛应用,基于B/S的多层Web体系结构正在不断的发展完善,并逐渐成为Web应用开发的主流。但是,在现有的Web应用系统中,普遍存在着程序可重
涉及国家安全的各种秘密信息,直接关系到国家的安全利益和社会的稳定。国家机密信息一旦被窃取或破坏,将对国家造成不可估量的损失。在信息安全攻防技术发展到了较高水平的今
当前针对网络外部的入侵攻击已有相对完善的防护措施,但针对来自系统内部的用户威胁则缺乏针对性的措施。尤其在国防、公安、金融等领域,来自系统内部的越权访问、信息窃取、
Bernoulli数、Stirling数、Euler数在组合数学、函数论、理论物理及近似计算等方面均有广泛的应用。在数字图像中,可以利用欧拉数来描述物体结构,保持图像特征不变;在离散数学中
指针式仪表有很多优点,因此在生产生活中有巨大的存量,而且每年都在增加。面对大量需要进行检定的指针仪表,采用人工读数的方式检定仪表读数不仅成本高效率低,而且读数精确度