基于数据压缩与纠删码技术的重复数据删除系统研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:ni_gejianren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究发现,存储系统中有高达60%的数据是重复的,大量重复数据的存在不仅浪费了存储空间,而且给数据的处理速度和计算的准确性带来很大挑战。近年来,重复数据删除技术逐渐成为研究热点。在重复数据删除系统中,数据块对所有的文件都是共享的,如果某个数据块发生错误或丢失,会造成多个文件无法还原。有些研究者提出将纠删码技术引入重复数据删除系统中,因纠删码编码时会产生多个额外的校验块,使编码后数据块的存储容量大于原始的单个数据块。针对此问题,本文在纠删码技术的基础上将数据压缩技术引入重复数据删除系统中,最后通过实验发现,基于数据压缩与纠删码技术的重复数据删除系统不仅提高了系统的可靠性,同时减少了存储空间的浪费。本文完成的主要工作有:  (1)研究并实现了重复数据删除系统保存文件和还原文件的流程。本文首先编码实现了重复数据删除系统的整体架构,文件切分采用固定切分算法,指纹库查找采用HASH查找算法。通过实验初步验证重复数据删除系统可以大大减少存储系统中的重复数据。  (2)研究并实现了基于纠删码技术的重复数据删除系统的整体架构。为了提高重复数据删除系统的可靠性,一些研究者提出采用冗余备份技术,但冗余备份技术对存储空间是一种极大的浪费。本文在参考大量资料的基础上将纠删码技术引入重复数据删除系统中,实现了基于Reed-Solomon纠删码技术的重复数据删除系统保存文件和还原文件的流程。由于在进行纠删码编码时为了数据块重构会额外编码出多个校验数据块,相对于原始数据块来说造成了一定存储空间的浪费,在此基础上本文完成了第二项工作。  (3)将数据压缩技术引入到基于纠删码技术的重复数据删除系统中。本文在参考现有的几种无损数据压缩技术的基础上,将Huffman压缩技术引入基于纠删码技术的重复数据删除系统中,实现了基于Huffman数据压缩和纠删码技术的重复数据删除系统保存文件和还原文件的流程。保存文件时,纠删码编码完成后对编码的数据块进行Huffman压缩,将压缩后的数据块保存到不同的存储节点,还原文件时,先将压缩后的数据块解压缩为纠删码编码数据块,进而还原出原始文件。  (4)最后,本文利用一套实际运营的管理信息系统中数据库的数据文件、日志文件和备份文件进行文件保存和还原实验,通过实验数据发现,基于数据压缩与纠删码技术的重复数据删除系统不仅提高了数据的可靠性而且减少了存储空间的浪费。
其他文献
随着高新技术的飞速发展,固态盘被引入到存储系统中,它的高性能、低能耗等特点能够满足现代数据存储的需要,对解决传统磁盘的性能瓶颈起到了很好的作用。但是固态盘的价格高,容量
Nand Flash是目前消费性电子产品中被广泛使用的元件之一。由于Nand Flash的物理机构特点,容易发生错误,如何保证数据的可靠性,成为一项重要的研究课题。采用纠错码(Error Corre
作为生物认证技术领域的重要一员,基于手掌的身份认证系统正以其安全、准确、快捷的特点而受到越来越广泛的重视,具有广阔的应用前景。本文针对掌纹认证系统若干关键技术进行了
评论文本的观点挖掘是指通过对评论文本中的观点、立场等主观信息进行挖掘与分析,判断评论文本中观点的情感倾向性。随着评论文本在人们生活中的广泛应用,仅仅挖掘评论文本的
随着移动终端设备的发展,一种新兴的医疗保健模式移动医疗迅速发展。未来,移动医疗发展潜力巨大。本课题设计实现了面向云平台的心电交互系统。系统包括数据采集端,心电监测
近年来随着移动互联网的兴起,市场上出现了越来越多的嵌入式解决方案,包括手机解决方案、IPTV解决方案、安防监控解决方案等等。不同厂家都推出带有自身特色的解决方案,配套各自
数据挖掘是当今计算机科学中快速发展的一个研究方向,它涉及到多个领域的知识。数据挖掘能从大量的数据中发现一些人们事先未知的、潜在的、有趣的知识,因此广泛被应用于商业分
抠图是一种精确提取任意图像或视频中前景物体的图像处理技术。该技术最早可以追溯到19世纪50年代的光学抠图,现在随着计算机工业的迅猛发展,数字抠图取代了传统的光学抠图并
多智能体系统的分布式协同控制有着十分广泛的工程应用前景,在工业和军事领域中,广泛存在着多智能体系统的协同控制,比如无人驾驶飞行器、无人驾驶车辆的合作控制、无人车的
近年来,随着物联网等新概念的提出和计算机技术的进步,嵌入式系统正以前所未有的速度发展,各种新型的嵌入式设备不断涌现;而且这些新出现的设备对智能化和实时性的要求越来越