基于差量压缩的重删系统恢复性能优化研究

来源 :王丰 | 被引量 : 0次 | 上传用户:ivyjiawx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据去重技术和差量压缩技术作为冗余数据消除的重要手段,已经受到越来越多的关注。数据去重可以消除存储系统中相同的数据块,而差量压缩则可以对存储系统中不相同但相似的数据块进行进一步冗余数据消除。然而,在数据去重系统上引入差量压缩技术虽然能够消除更多的冗余数据,但也导致了系统恢复性能的下降。在联合差量压缩的数据去重系统上,数据去重引入的重复块碎片和差量压缩引入的基本块碎片导致了对磁盘的额外访问,从而降低了系统的恢复性能;此外,重复块碎片中的自重复块碎片作为差量压缩的基本块会进一步导致系统恢复性能的损失。为了解决差量压缩引入的碎片化问题,提出了一种在数据去重阶段和差量压缩阶段分两步进行碎片块识别的重写方案,即两步重写方案。(1)在数据去重阶段,设计了差量压缩感知的联合重写方法,对于自重复数据块,联合重写方法将数据块写入到一个分段中,并统计该分段中所有重复块和差量块引用的容器信息来进行重复块碎片识别;对于非自重复数据块,联合重写方法会维护一个统计了所有稀疏容器的列表,并检查当前重复块是否在该列表中来判断该数据块是否是一个碎片块;(2)在差量压缩阶段,设计了基于局部性的双向信息重写方法,包括了利用过去信息的模拟恢复缓存识别方法和利用未来信息的延迟重写窗口识别方法。模拟恢复缓存方法能够在差量压缩阶段识别基本块不在恢复缓存中并导致额外磁盘读取的基本块碎片;延迟重写窗口方法能够通过对后续数据块信息的收集,避免在后续被访问的数据块被错误识别为碎片化数据块。在保证存储系统冗余数据消除率的同时提高了数据去重系统的恢复性能。在开源的数据去重系统destor和数据集Wordpress、Linux、Vmdk和GCC上的对比实验测试表明,相对于无重写的结合差量压缩的去重系统,在冗余数据消除率损失4.7%-6.9%的情况下,两步重写方案的恢复性能是基准系统的1.73-7.28倍。
其他文献
无线传感器网络(Wireless Sensor Works,WSN)和物联网的飞速发展使得微小型传感器的规模迅速扩大。目前,这些器件主要依靠电池供电,但电池储能有限,需定期维护,推高了各种传感器网络的使用成本。环境振动能收集技术为解决这一问题提供一个潜在地解决方案。然而,环境中的振动能普遍具有频率低的特点,其收集利用难度高。对于俘能器而言,机械振动可分为加速度激励(俘能器与振动源固定)和位移激励(
学位
随着大数据时代的发展,分布式内存系统已经被广泛应用来提供高性能的服务,由新型非易失性存储器设计实现的分布异构内存系统可进一步提供更好的性能。通过在本地客户端增加缓存,可以减少对远端服务器的访问,从而减小分布式系统的延迟来提高性能。然而加入客户端缓存会引发分布式系统中的缓存一致性问题,当多客户端共享同一远端数据时,需要保证本地缓存副本的数据与远端存储对象的数据是一致的。但在分布式系统中实现缓存一致性
学位
现阶段毫米波雷达凭借自身优势成为汽车驾驶应用的关键传感器,同时又因汽车雷达工作环境复杂多变,导致噪声或干扰混入回波信号,所得目标探测参数就会存在误差。而目标跟踪滤波目的在于抑制噪声带来的影响,为更准确地估计目标状态,目标跟踪是必不可少的。本文以车载毫米波雷达为背景,研究毫米波雷达的目标跟踪算法,并基于TDA3x硬件平台提出实现毫米波雷达目标跟踪的方案。首先介绍毫米波雷达的基本原理,包括毫米波雷达的
学位
当前的大规模存储系统广泛使用纠删码技术,它以条带的形式存储数据实现容错,使得在满足相同容错的情况下,比副本容错技术拥有更低的存储成本。为进一步降低存储成本,学术界和工业界开始研发“大条带纠删码(Wide-Stripe Erasure Coding)”技术,通过增加大条带的长度来压缩校验块在每个条带中的比例,从而节省更多存储成本。然而,大条带纠删码由于条带过长而导致校验块的编码计算量大、编码效率低,
学位
硬盘的可靠性很大程度上决定了存储系统的可靠性,如何在硬盘发生故障前进行预警成为研究热点。硬盘一般通过自我监测、分析和报告技术(Self-Monitoring Analysis and Reporting Technology,S.M.A.R.T.)系统采集每天的运行数据,根据监测属性值的变化进行预警,但该方法预测硬盘故障的成功率较低。目前主流研究方法将硬盘故障预警问题看作是时序数据分类或预测问题,
学位
以通讯、导航、探测、计算机、雷达为代表的电子装备结构复杂,研制周期短,更新换代快,品种多批量小,可靠性要求高。在电子装备设计、制造、检测、运维的全生命周期各阶段,都需要具备对装备的加工、装配、使用、维修、保养和故障排除的能力,而直观、精准、可交互的产品技术手册是实现这一目标的关键所在。传统的技术手册存在制作效率低、可交互性差、不直观、查询检索困难低等问题,无法满足电子装备定制化、数字化、集成化的发
学位
随着人工智能、物联网等技术不断的升级和应用普及,全球数据呈爆发式增长。大量的数据频繁在处理器和存储器之间交换和处理,这种信息存储单元和计算单元分离的计算架构,严重的制约了处理器的计算性能。忆阻器因其良好的非易失性存储和逻辑计算功能、高速、低功耗、可与CMOS工艺兼容等特点,成为最重要的存算一体化器件之一。然而忆阻器导电通路形状和通断部位的随机性导致器件的一致性较差,严重的限制其产业化应用。因此,导
学位
长期以来,考试都是一种有效的学情评价手段,但在传统的手工阅卷和现代的网上阅卷过程中,存在教师阅卷工作量繁重,对学生的学情评价只能依赖教师手工进行等问题,为教师增添了额外的工作量。在“双减”的背景下,如何在切实减负的同时有效提升教学质量,对教师的教学工作提出了更高的要求,要求教师对学生的学习情况有更加精准的认知,从而展开针对性的教学,真正达到因材施教的目的。通过对考试及学情评价全过程的分析,结合人工
学位
海量数据的爆发式增长,对存储设备的容量、性能和可靠性提出了新的要求。机械硬盘作为现代存储系统的重要存储设备,易发生机械故障导致数据损坏与丢失的事故。因此,高效监测磁盘状态并及时预警故障,有利于建立高可用的存储系统。现有研究建立的磁盘故障预测系统通常有磁盘生命周期量化简单、应用场景特殊或上线成本高的局限性,不适用于通用场景。当前基于深度学习(Deep Learning,DL)技术能智能精简地预测磁盘
学位
目的:1.描述健康成人在中长跑运动前、运动中、运动后三个阶段的心率变异性(Heart rate variability,HRV)的变化特征。2.分析影响健康成人在中长跑运动中心率变异性(Heart rate variability,HRV)的因素。方法:1.2021年7月至10月招募同济医学院社区内的健康成人作为研究对象。对研究对象进行问卷调查、体格检查和8圈(3.2公里)中长跑测试,问卷调查包括
学位