云备份系统的恢复性能优化算法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:chuanqi2009444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云存储技术的成熟和流行,采用第三方云存储的云备份系统也越来越流行。云备份系统采用重复数据删除技术来去除各个版本间的共享数据块。重复数据删除模块用一个指向旧数据块的地址代替删除的数据,重复数据块不会被上传到云端。备份数据流中连续的数据块实际上是分散地存储在段(云端数据存储的基本单位)中的,这就导致了数据恢复过程中数据碎片的问题。当用户恢复最新版本的数据时,所有被引用的段都会从云端被下载到本地,而这些段中包含的一些未被引用的数据块也会被下载,这就降低了恢复性能。为了解决这个问题,设计并实现了一个基于重复数据删除技术的云备份系统,为系统进行了合理的模块划分,使得系统可以高效的进行备份以及恢复操作,并且可以工作在多种模式下。为了解决重复数据删除导致的恢复性能下降问题,提出了一种近似精确的去碎片方法(Near-Exact Defragmentation,NED)。NED首先计算每个被引用的段的段引用率,即某个段中被数据流引用的数据长度除于段长度。如果段引用率小于指定阈值,则数据流中引用这个段的数据块将被标记为数据碎片,数据碎片将会被写到新的段中。通过有效地识别碎片化的数据块,NED在轻微降低重复数据删除率的情况下,能有效地减少数据恢复过程中的数据下载量。实验结果显示,NED能提高恢复性能6%~105%,而损失的重复数据删除率仅为0.1%~6.5%。
其他文献
在能源枯竭与环境污染日趋严重的背景下,太阳能作为一种清洁的可再生能源以其资源丰富、分布广泛和开发前景广阔的优点,愈来愈受到了世界各国的重视。而光伏发电是太阳能目前使
本文提出了一种改进的向量空间模型(VSM)用户单兴趣表示法及其动态学习算法,实验表明该算法能够实时捕捉和记录用户最新的兴趣需求,并能自适应地调整和更新用户模板。在此基
现实世界中实体间的关系可以图数据来表示。图算法用来对图数据进行数据挖掘。数据图处理系统提供了接口给用户实现图算法。数据图处理系统执行算法时普遍采用确定性的并行执
随着计算机技术在会计领域应用的日益深入,传统的手工会计核算手段正逐步被以计算机技术应用为特点的会计电算化核算取代,会计的电算化必然导致会计信息化审计,传统的审计方法和
随着网络技术和通信技术的不断发展,用户对网络的需求日益多样化,基于IP交换网络的多点视频会议系统的实现由于其成本的低廉,交互性强大,多点共同参与的特点和优点成为了人们通过
随着网络入侵和攻击行为的日益增多,网络信息安全的相关问题逐渐引起人们的重视。目前,已有的网络安全产品己无法实现对整个网络安全状况的准确监控,网络安全态势感知的研究也随
随着科技的不断进步,人类已经进入了一个全新的“信息时代”。互联网已经成为了当前主流的信息载体之一。面对互联网上的大量舆情信息,如何实现对其进行有效的监控和筛选也成
智能客户端综合胖客户程序和瘦客户机程序的优点,克服它们的缺点,具有充分利用本地软件和硬件资源、利用网络资源、支持联机/脱机操作、提供程序智能部署和自动更新、支持多种客
对等网络是近年来兴起的一个研究热点,与此同时应用层组播也随着网络带宽的不断提高而得到了广泛的应用。与C/S模式相比P2P技术加强了任意计算机之间的直接交互,使网络上闲散的
面向服务架构(Service-Oriented Architecture,SOA)是最近几年业界广泛讨论的名词。经过这几年的深入讨论,SOA的含义以及SOA架构的优点逐渐明确。本文首先介绍了现有企业应用集