闪存错误时空特性感知的固态盘可靠性算法优化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:l4511520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
固态盘(Solid State Drive)因具有高内部并行性、低随机访问延迟、低能耗以及小尺寸等优势,作为主流的存储设备被广泛用于个人电脑和数据中心。近年来,随着5G和大数据技术发展,对存储容量、性能和可靠性提出了更高需求。得益于半导体制程工艺技术、单元多比特技术以及三维堆叠技术的发展,闪存存储密度大幅提升。然而,存储密度的增长是以牺牲可靠性为代价,不可靠的存储介质会引起数据存储可靠性维护开销大和闪存空间利用率不足的问题。因此,如何设计具有高效能、可靠的闪存存储系统,成为了研究热点。
  为了保证数据存储的可靠性,现有的可靠性算法引发了高昂的存储性能开销。例如,固态盘利用纠错码(Error Correction Code,ECC)纠正数据错误和块级阵列编码(Redundant Arrays of Independent Disks,RAID)提供系统级容错保护。纠错过程中产生的解码延迟、块级阵列编码中繁重的校验冗余数据和数据重建操作,极大地影响了系统性能。而且,为了满足闪存存储密度扩展带来的高可靠性需求,固态盘利用过长纠错码(即纠错码校验数据大小超过系统配置的校验数据空间)提高系统的纠错能力。然而,基于过长ECC存储策略中引发的读放大,大幅降低了系统读性能。
  为了充分利用盘内多级并行性,控制器通常将不同并行单元间相同块编号的闪存块链接成超级块,并以超级块作为盘内闪存空间的管理粒度,在提高系统吞吐量的同时,均衡超级块内闪存块承受的编程/擦除次数。然而,由于闪存块间耐磨损力差异,超级块中弱块会过早损坏,加速了系统故障,致使固态盘失效时,大量闪存块未被充分利用,降低了固态盘内闪存空间利用率。
  针对上述问题,围绕闪存错误时空特性,展开如下可靠性算法优化研究:
  为了解决高解码延迟和过长ECC存储导致的读性能下降的问题,首先研究了闪存错误的时间特性(即闪存块的原始误码率随着编程/擦除次数的增加呈现指数型增长),然后探索了闪存生命期内需要的校验冗余数据与系统配置校验数据空间的关系,发现在闪存生命期早期(即闪存块承受的编程/擦除次数较小时),系统配置的校验数据空间没有被充分利用;在生命期末期(即闪存块承受的编程/擦除次数过大时),配置的校验数据空间无法满足系统可靠性需求。基于上述发现,提出了一种闪存错误时间特性感知的纠错码数据管理策略(LAE),根据闪存错误时间特性自适应调整纠错码数据管理策略。在生命期早期,充分利用配置的校验数据空间,利用短码长的纠错码降低解码延迟;在生命期末期,将过长ECC对应的校验数据作为用户数据的扩展,持久化到不同的并行单元中,充分利用盘内多级并行性,降低过长纠错码引发的读放大对读性能的影响。实验结果表明,与传统ECC编码策略相比,LAE可提升系统读性能最大达85.1%;与目前基于过长ECC的数据存储策略相比,LAE可提高系统读性能最大达30.0%。
  针对盘内RAID组织策略中存在的繁重校验数据和数据重建导致的高昂存储性能开销问题,首先研究了固态盘生命期内的可靠性需求,发现RAID提供的可靠性在生命期大部分时期未被充分利用。然后探索了闪存错误空间特性(即经历相同编程/擦除次数的闪存块具有不同的原始误码率),提出了闪存错误空间特性感知的RAID条带管理策略(WARD)。一方面,WARD根据闪存块的实时磨损动态组织RAID条带,在保证数据存储可靠性的前提下,减少校验数据对系统性能的影响;另一方面,提出预警转移机制,提前迁移坏块中的用户数据,避免数据重建过程带来的性能抖动问题。实验结果表明,与传统的RAID组织策略相比,WARD在生命期内提供高且稳定的可靠性,读性能和写性能最大提升分别为19.5%和25.6%。
  为了提高基于传统超级块组织策略的固态盘寿命,本文首先探索块级与页级的闪存错误空间特性,然后提出闪存错误时空特性感知的超级块组织策略(WAS)。WAS将页级闪存错误空间特性与闪存块磨损检测相结合,设计了一种高效准确的闪存块磨损实时检测策略。基于闪存块的实时磨损,WAS动态地组织超级块,让强块分担原本施加到弱块上的磨损,并且利用一种基于磨损的垃圾回收策略,进一步降低闪存块间的磨损差异,提高固态盘内空间利用率,延长系统的寿命。实验结果表明,WAS策略与传统超级块组织策略相比,以可以忽略的性能开销为代价,提高了30.78%闪存空间利用率,延长了51.3%固态盘寿命。
其他文献
量子信息与量子计算领域中两个著名的研究成果——BB84密钥分配协议(Bennett-Brassard protocol proposed in 1984)和Shor的质因子分解算法——均对现有的密码体系产生了深远的影响。然而,更具广泛应用前景的Grover迭代算法在穷举搜索之外的密码学应用还未经充分研究。此外,另一类典型的量子迭代运算过程——量子随机行走——的非马尔科夫模式(或具有记忆的量子行走算
数据建模是机器学习和人工智能领域的重要研究问题,聚类分析可以有效地挖掘数据内在的模式和规律。复杂网络(图数据)作为新的研究热点,对理解社会复杂系统有着重要的作用,可以有效地用于推荐系统、恐怖组织挖掘等问题。近年来,网络结构的动态演变给社团检测建模提出了新的挑战,如何采用高效的学习模型挖掘动态复杂网络内在的规律,实现社团检测和演化分析,成为动态复杂网络研究的重点。从动态复杂网络中节点重要性、社团结构
语义分割旨在为图像中的每个像素分配一个预定义的语义类标签,使计算机能够通过视觉的方式对场景进行细粒度地理解。该技术被广泛应用于自动驾驶、城市规划、智能家居等任务中,是计算机视觉领域的重要分支。近年来,基于深度卷积神经网络的分割技术将任务性能提升到了一个新的水平。然而,现有的深度学习方法需要大量的像素级人工标注图像作为训练数据,使得这些方法所需的时间和金钱成本十分昂贵。为了减轻手工标注数据带来的沉重
学位
异构并行系统通常是指由中央处理器(Central Processing Unit,CPU)与图形处理器(Graphics Processing Unit,GPU)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)等协处理器共同组成的计算方式异构的高性能计算系统,因能提供更为高效的应用加速能力而被广泛部署,在大数据、人工智能等众多关键领域得到了广泛应用。当
Android(安卓)操作系统占据了智能终端操作系统的大部分市场份额,搭载Android操作系统的智能设备成为主流。由于移动智能终端携带了较多的用户隐私信息,同时Android应用的安全机制存在一定的局限,导致Android应用可能存在严重的安全隐患。需要对Android应用的安全机制特别是权限机制进行深入的研究,分析Android应用中的权限安全风险。同时关注和研究Android应用的安全漏洞,
学位
由于互联网信息的快速增长,用户面临着信息过载的问题。借助数据挖掘和人工智能领域中的相关技术,推荐系统能够帮助用户快速找到其感兴趣的信息,在社交网络、电子商务、在线阅读和广告投放等领域得到了广泛的应用。随着互联网应用的多元化发展,传统的推荐模型难以直接运用到新领域中以解决相应的问题。  以智能手机,笔记本电脑等为代表的电子产品更新换代通常较为频繁,而用户对于此类产品的消费周期则相对较长。传统的推荐系
学位
随着计算机软硬件技术的飞速发展,传统的动态随机访问存储器(Dynamic Random Access Memory,DRAM)因其存储能耗大、存储密度小、可扩展性有限等缺点已经无法满足应用越来越大的内存需求。新兴非易失性存储器(Non-Volatile Memory,NVM)尽管可以避免此类问题,但因其访问时延高、写次数有限及写功耗大,也无法直接作为系统内存。因此,混合使用小容量DRAM和大容量N
学位
随着计算机网络的发展以及智能手机等多媒体获取设备的普及,多媒体数据呈爆炸式增长,其中图像和视频数据已经成为大数据时代的主要数据类型。如何在海量的图像中以较小的时空开销准确找到用户感兴趣的图像成为多媒体领域的研究热点。针对图像的底层特征与高层语义间的“语义鸿沟”问题,以及全局图像表示缺乏几何不变性和空间占用较大的问题,利用深度学习、特征编码、哈希学习等方面的知识,论文系统探讨了图像检索系统中的描述符
学位
信息技术的发展促使数据规模急剧增长,进一步推动了云计算技术的发展与成熟,使得越来越多的企业和个人将业务或应用迁移到云计算平台上。在云计算平台中,云服务提供商往往采用共享服务架构,并通过虚拟化技术向用户交付服务。比如将租户应用部署在虚拟机内,而虚拟机共享计算、存储和网络等物理资源。共享服务架构能够提高资源利用率并降低管理成本,但会引入资源竞争,使得租户间的性能相互干扰。云存储系统作为存储服务的载体,
磁盘是数据存储最常用的设备之一,磁盘故障预测是保障数据可靠性的重要技术手段。磁盘故障预测方法一般可以分为两大类:设备级故障(即整盘故障)预测和扇区级故障(即局部磁盘故障)预测。学术界采用一些传统机器学习方法,例如支持向量机、逻辑斯特回归、决策树和随机森林等,预测磁盘故障并取得了一些成果。但是,这些研究仍然存在以下三个方面不足:(1)面对实际数据中心中单一型号数量较少(小样本)磁盘的故障预测问题,预
学位