【摘 要】
:
随着信息技术的不断发展,我们正处在一个数据量爆炸增长的时代,同时也是一个越来越依靠数据进行决策的时代。传统的存储技术在面对海量数据的挑战时已经露出疲态,其扩展性差
论文部分内容阅读
随着信息技术的不断发展,我们正处在一个数据量爆炸增长的时代,同时也是一个越来越依靠数据进行决策的时代。传统的存储技术在面对海量数据的挑战时已经露出疲态,其扩展性差、数据安全性低、维护和管理的成本高、灾备能力差等等的缺点日渐暴露。如何高效地处理和存储海量的数据成为信息科学技术所要不断改进和解决的问题。Hadoop具有高可靠性,高扩展性,高效性,低成本的特点并逐渐发展成为了系统完备的大数据系统生态圈,为大数据的开发提供了全面的解决方案。毫无疑问,Hadoop已经成为了大数据行业发展的强大驱动力。HDFS在面对大量的小文件存储需求时,出现Namenode的内存占用过高,Namenode交互频繁,引起Namenode单点故障,集群效率低下的问题。提出单层索引的小文件归档结构。本文在Hadoop自带的小文件合并方案Hadoop Achive上进行改进,优化Hadoop Achive归档文件的索引结构,将Hadoop Achive的两层索引结构改为一层索引结构并且使用效率更高的哈希函数,提高从归档文件中读取小文件的效率,同时减少Namenode的内存占用。提出运用一致性哈希算法改进索引文件在Namenode的分布问题,利用一致性哈希算法在对比普通取模所具备的扩展性和容错性,使得集群数据在集群发生改变的时候受到的影响最小,同时保证一致性哈希算法的负载均衡能力,并且使数据的分布适应服务器存在差异的处理能力,分析了 Namenode Federation所存在的负载均衡问题,为其架构的改变做出部分工作。
其他文献
随着信息科学技术的不断发展进步,物联网、智慧城市、社交网络、精准医疗等事物不断融入并影响我们的日常生活工作。互联网作为信息的源头以及传播和再加工的平台,“信息泛滥
5G与4G网络相比,5G网络的通信业务量将呈爆炸式增长,系统的能耗问题将更为严重。绿色通信是未来发展的必然要求,为了实现绿色通信,5G网络的研发要充分考虑绿色技术和绿色策略
随着社会的不断发展,锂离子电池以其独特的储能及充放电优势正在逐步的占领社会发展的潮头。与现存各类储能电池,如锌锰电池、铅酸电池、太阳能电池等相比较,锂离子电池具有
第一部分gC1qR基因致宫颈癌细胞生物学性能的改变目的:球状C1q受体(globular C1q receptor,gC1qR)是一种高度酸性的受体蛋白。可介导多种生物学反应,本部分探讨gC1qR在宫颈癌
随着时代的进步和社会的发展,人们在物质需求满足的基础上,开始转而追求精神的需求。体育旅游既能够达到锻炼身体的目的,也能够使人们在运动过程中欣赏美丽的景色,因此,近年
如今许多的的大型应用程序都会提供很多复杂的、多样性的、商业化的功能。通常软件公司为了保证在将软件交给用户使用后不至于出现较多或较大的问题,都会在交给用户前对其做
随着国民经济的快速发展,电力系统的不断升级完善,配电网部分作为电力企业与用电客户之间的连接纽带,在电力系统中有着举足轻重的作用,用电客户的生产生活中的安全用电也依靠
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术作为新一代无线通信系统的核心技术早已经被大量应用在各种通信环境中。随着终端移动速度的提高,例如近
我国于2013年12月废除劳教制度,社会治安的三级制裁体系向二级制裁体系转换,进而我国刑法的结构性缺损和轻微罪体系的缺位凸显出来。刑事制裁体系面临犯罪圈调整、刑罚与行政
物权变动的主S有三:其一是法律行为,其二是事件和事实行为,其三是公法上的原因,如征收和没收。而基于法律行为的物权变动在大陆法系国家又分为三种不同的模式,分别是意思主义