海量数据消冗系统的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liongliong446
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重复数据删除(数据消冗)技术是存储领域的一项新兴技术,也是各大存储厂商和研究所追捧的热点,它可以有效缓解存储空间的紧张局势,更高效的进行数据存储。本文研究的海量数据消冗系统正是基于重复数据删除技术实现的一种新型数据存储机制,可以去除大量的冗余数据,降低网络带宽占有率,对缩减数据占用空间、消减存储成本具有重要的意义。首先分析比较几项主流数据消冗算法的优缺点,提出了一种并行层次化的重复数据删除算法PHD(Parallel-Hierarchical De-duplication),通过由粗粒度到细粒度的层次化数据消冗来提高数据去重率,并在此基础上引入并行处理以充分利用多核计算机资源解决重复数据删除速率低的问题。其次针对消冗系统数据存储和访问的关键技术,研究实现了基于动态哈希和key-value的两种存储组织结构,并提出了基于Bloom Filter过滤、内存查询和磁盘查询的三级查询策略来提高系统的访问效率。最后构建大并发通信平台,应用PHD消冗算法、基于动态哈希的存储结构和三级查询策略完成海量数据消冗系统的实现,并进行功能和性能两方面的测试分析。测试结果表明,该海量数据消冗系统不仅拥有很高的数据消冗率,而且具备较好的数据消冗速率,能够更高效的进行数据保护。
其他文献
汽车产业是我国国民经济重要的支柱产业。汽车产业的飞速发展带来的高消耗、高排放给资源和环境带来了极大的压力。根据2010年9月份公布的《节能与新能源汽车产业规划》草案,国家对节能减排和培育战略性新兴产业的进行了总体部署,我国汽车工业正朝着大力发展新能源汽车方向迈进。纯电动汽车以其高效节能、零排放的优势,成为新能源汽车的典型代表,并成为我国汽车工业转型的主攻方向。根据我国汽车产业“十二五”规划,到20
随着互联网通讯技术的发展,出现了一种新型的基于LAN的LXI总线综合测试技术。LXI具有传输速率高、体积小、成本低和集成方便等优点,得到了市场的广泛认可,成为新一代综合测试
风险评估是风险管理中的问题定义阶段,其准确性和质量将决定风险管理工作的效果,是重要的阶段之一。对于武器装备开发的风险评估,国内研究过于强调数学模型的运用,缺乏必要的
三维信息是目标的本质属性,具有稳定、抗干扰的特点,基于三维信息的目标检测与识别在军事、工业、民用等各个领域都得到了广泛地应用。相对于基于图像的二维目标识别技术而言
硅在氢氧化钾溶液中呈各向异性腐蚀特性,利用此特性可以制作多种非球面、非对称的微光学折射结构。通过计算机对此特性进行模拟与仿真,可以便捷高效地输出各工艺阶段所需的参
随着空间技术的发展,分离模块航天器凭借其广阔的应用前景受到了广泛的关注。模块航天器小型化、模块化、低成本化、网络化和易维护化的发展趋势,对航天器动力学、姿态控制、
创新是人类主观能动性的高级表现形式,是推动民族进步和社会发展的不竭动力。对于企业而言,产品创新不仅能扩大市场份额,获得更高利润回报;而且对于激烈的市场竞争环境,产品创新也是应对市场竞争的有效手段。因此,对技术创新过程与方法的研究具有重要的理论意义和实践价值。论文运用系统工程思想,将决策理论和技术路线图方法应用于创新过程与方法的研究,详细描述技术路线图过程与方法对创新设计的作用,阐述如何利用技术路线
本文以智能SAW瓦斯传感器为研究对象,在对国内煤矿安全现状及国内外瓦斯传感器研究现状进行深入分析的基础上,针对煤矿井下信息量大、噪声多、随机动态等特征以及单一数量值
无线传感器网络系统综合了传感器技术,嵌入式技术,计算机技术,分布式信息处理技术和通信技术,能够协作的实时地监测,感知和采集网络分布区域内的各种环境或监测对象的信息,并对这些
PET(Positron Emission Tomography)图像分割是临床医学中极为重要的一个环节,它能够帮助我们准确定位病灶区域,对病人的治疗具有重要意义。关于PET图像的分割,目前已经有许