Ceph存储技术中CRUSH算法的研究与改进

来源 :成都信息工程大学 | 被引量 : 2次 | 上传用户:just1015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了适应大数据应用场景逐步由计算中心向数据中心转变,分布式存储系统作为底层基础设施之一,面临多方面的挑战,包括数据量的增长速度、数据种类的多样性、愈来愈高的性能需求等。针对这些变化,分布式存储技术中首要解决的三大技术难点有:数据一致性、数据可靠性和负载均衡;数据分布问题直接影响集群的负载均衡,优秀的数据分布算法对一个分布式存储系统尤为重要。CRUSH(Controlled Replication Under Scalable Hashing)算法是Ceph分布式存储系统中的数据分布算法,该算法通过实际的集群物理架构,建立一个多层次的映射表,根据层次结构进行迭代,返回一组最适合存储数据对象的存储节点;该算法使用一致性哈希算法来产生伪随机数,并结合了节点权重进行加权运算。因此,该算法分配存储位置的时候考虑了集群当前的存储情况,在大多数情况下能够保证数据分布足够均匀,不会影响集群的负载均衡;由于数据对象的大小、集群规模以及实际的部署结构都作为参数参与了CRUSH算法的运算过程,所以三者之间存在互相影响,互相制约的关系。在实际应用当中,如果存储的单个数据对象太小,影响节点权重的变化较小,容易造成一组相关性高的数据存入同一组存储节点中;针对这一组数据进行访问的时候就会产生负载均衡问题,即某些节点的使用率过高,而大部分节点空闲,使整个集群的性能急剧下降;另外一方面,如果对集群的存储规模进行改动,如扩容、删除历史数据、备份、节点故障等造成集群节点的权重值差异也会导致小文件数据对象落入相同的节点,造成存储分布不均匀,进而影响集群的性能。经研究发现,上述问题是由CRUSH数据分布算法所引起的,CRUSH算法没有充分考虑数据的多样性和集群规模的扩展性对数据分布的影响;因此,论文通过对CRUSH算法进行改进。概括起来论文研究的主要内容如下所示:(1)对Ceph分布式存储系统进行研究,介绍Ceph相比传统的分布式存储架构具有的创新点和实现原理;通过模拟大规模集群,对Ceph分布式存储进行测试,验证了目前Ceph分布式存储系统确实存在数据分布不均匀的缺陷。(2)对CRUSH数据分布算法进行改进,增加温度因子约束小文件数据对象的存储;当CRUSH算法在选择结果时,除了优先考虑weight值高的节点,还要在每一次访问节点时增加被访问节点的温度值,当连续访问同一个节点时,温度值会以更快的速度增长,与weight值相反,CRUSH算法应当优先考虑温度值低的节点。(3)将改进的CRUSH算法以动态链接库的方式应用到Ceph分布式存储系统中,增加了部署Ceph的灵活性,根据实际情况选择是否需要优化,以参数的形式进行调整,无需对整个集群进行备份和重启。基于上述研究内容,建立实验环境,搭建Ceph分布式存储集群,模拟多种应用场景对集群进行测试。最后,论文通过rados bench静态统计数据分布情况;使用iostat动态记录和分析每个存储节点中磁盘使用率;使用不同参数的iozone工具对整个集群进行吞吐量(Throughput)验证对比改进前和改进后的集群性能,验证改进后算法的可行性和优化程度。实验结果表明,改进的CRUSH算法能够解决小文件存储所引起的负载均衡问题。
其他文献
竹燕窝是一种珍贵的食材。为了深入了解竹燕窝的生长规律,采用电镜扫描和固定观察等方法连续观察了竹燕窝3个月的生长情况。结果发现:竹燕窝在生长初期时主干是白色透明的,少
目的 分析丁苯酞软胶囊结合依达拉奉用于治疗脑梗死的临床疗效。方法 2017年1—6月,于我院收治的脑梗死患者中选取500例,以治疗方式为依据,将其分为两组,两组患者均接受抗血
可闻声速测定仪是以可闻声音作为声源,和原有的超声波声源声速测定仪相比,实验更加形象逼真。可闻声速测定仪所选用的元件和材料都是实验室常备的,并且该测定仪的结构简单易
【目的】观察燕窝提取物体外抑制H5N1禽流感病毒的作用。【方法】制备燕窝水提物、燕窝水提物人工胃液消化物、燕窝水提物人工肠液消化物。通过体外293T细胞转染方法,应用荧
目的研究头孢克肟干混悬剂治疗小儿急性细菌性肠炎的疗效。方法选取2014年4月—2017年4月我院收治的100例急性细菌性肠炎患儿作为研究对象,通过随机分组的方式,将其分为对照
<正>图1所示为Starlite Printers公司设计的燕窝礼盒包装,与传统四边形礼盒不同,该盒六边形的设计带来了眼前一亮的货架效果。该包装为消费者友好型,透过盒身正面窗口可清晰
通过互联网大面积传播扩散暴恐音视频,其危害性表现在鼓吹极端思想、腐蚀群众意识形态、传授犯罪技能、诱发新的犯罪。有效遏制暴力恐怖犯罪行为,必须严厉打击、控制暴力恐怖
采用量子化学半经验方法RHF/PM3,对四种金属有机配合物分子进行构型优化,对优化后的构型作振动分析,均未出现虚频率,在此基础上用RHF/CIS方法分别计算了它们的荧光激发光谱,所得结果
最近,财政部发布了修订后的新版。《注册会计师全国统一考试办法》(财政部令第55号),《办法》规定,从今年起,注册会计师考试划分为专业阶段考试和综合阶段考试。考生在通过专业阶段
本文主要分析内核级exploit和应用层的exploit不同之处,详细阐述了内核缓冲区溢出(kernel BOF)、内核格式化字符串漏洞(kernel format string vul)、内核整型溢出漏洞(keme lintege