应用感知的重复数据删除关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:yy6590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据的爆炸式增长,我们现在正处于大数据时代。一个亟待解决的问题是尽力提高大数据管理和分析的操作效率。在这种情况下,重复数据删除技术被广泛被应用到各种领域中,包括数据存储系统、数据备份系统、数据容灾、医疗等等,甚至向通信领域进行延伸。本文对重复数据删除系统的几项关键技术进行了分析和研究,并针对重复数据删除系统的性能优化提出了新的系统设计和相关算法。本文的主要创新包括以下几项内容:(1)提出了一种基于应用感知的重复数据预测机制。重复数据预测技术能够在执行重复数据删除之前,让用户了解重复数据删除系统的效用,为用户需要的存储系统空间大小提供参考。相比于现有的重复数据删除技术,应用感知的重复数据预测技术能够进一步减小预测索引表的大小,进一步提升了预测算法的性能。(2)提出一种索引表的自适应更新算法。以往的重复数据预测算法只能够根据固定的索引表项,预测数据集内部或数据集与存储系统之间的数据相似率。索引表自适应更新算法根据访问数据块的相关信息,不断更新索引表,能够同时考虑数据内部的冗余度和数据与存储系统中数据的冗余度,提高了重复数据预测算法的准确性。(3)对重复数据删除系统中的磁盘索引瓶颈问题进行优化,提出了一种基于热点数据识别的Cache替换算法。我们通过研究发现数据中重复次数较多的数据占数据总数的较大部分,我们称之为数据的重复性特征。利用数据的重复性特征,基于热点数据识别的Cache替换算法能够获得更高的Cache命中率,减少磁盘的读写次数,降低了磁盘索引瓶颈问题对重复数据删除系统索引操作性能的影响。上述几项应用感知的重复数据删除关键技术的研究成果,为云存储环境下的数据存储与管理提供了有效的优化手段。
其他文献
在无线传感器网络中,要求提供有保证的差别服务,同时能在全网范围内实现资源的充分有效利用,QoS路由是解决该问题的关键技术之一。本文综合考虑无线传感器网络的路径节点最小能
本文使用基于Voip的软交换技术,结合四川省凉州市110/119/120指挥调度中心的需求,设计并开发了基于SIP(Session Initiation Protoc01)的分布式呼叫中心系统,实现了用软交换机代
本文详细的陈述了安全电子邮件的各项技术,并对当前主流基于证书公钥密码体系的安全电子邮件系统进行分析,并引入了基于身份的密码系统。 传统的基于证书的公钥密码体制的系
人群仿真在社会群体安全、建筑设计、紧急疏散、教育培训、军事演练、数字娱乐、历史场景重现等方面具有广泛的应用价值。越来越多从事虚拟人研究的学者开始关注人群仿真技术
随着社会和科学的发展进步,今天的互联网也在飞速发展,人们对信息的需求越来越大,因而涉及信息安全的问题愈来愈突出,诸如视觉监控、远程教育、人机交互技术及安全等各方面都迫切
随着32位嵌入式微处理器性能的不断提高和嵌入式实时操作系统不断成熟,各种各样的新型嵌入式系统设备在人民生活和工业控制等领域得到广泛应用,在土木水利工程安全监测领域也发
学位
学位
随着IC产业的飞速发展和集成电路设计、制造技术的不断进步,SOC系统级芯片的设计已成为IC设计领域的主流和必然趋势。在SOC芯片的开发方法中,IP核复用技术已成为一种主流的设
构架PKI体系,最重要的是选择信任模型和建立认证中心CA。选择信任模型是构筑和运作PKI所必需的一个环节。构建功能完善的、安全的认证中心CA是PKI的核心技术。入侵容忍则是一