基于Hadoop的海量统计小文件存取优化方案

来源 :聊城大学学报(自然科学版) | 被引量 : 0次 | 上传用户:w313829237
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop作为一个开源的并行计算框架,它提供了一个分布式的文件存储系统HDFS.然而,当处理海量小文件时会产生NameNode内存使用率较高、存取性能并不理想的问题,导致NameNode成为系统瓶颈,从而制约了文件系统的可扩展性.本文结合统计工作,提出了一种小文件存储的优化策略,在HDFS之上增加小文件预处理模块将文件进行分类,合并成Mapfile,并建立全局索引,另外该策略引入了索引预取机制和缓存机制.实验证明,该方法能有效提高大批量小文件的存取性能.
其他文献
在互联网的风口,各色旅游网站和旅游手机软件发展迅速.为顺应互联网的发展,设计和开发了一个大学生出游网站.首先对网站的可行性进行分析,得出可行性结论.其次分析其定位、用
尽管目前我国还没有出台电动汽车的统一标准、政策,但已有数个城市成功研制、生产出了家用型电动轿车,并为其出台了必要的地方标准使其能够“合法上路”,鼓励本地电动汽车产业的
互联网的诞生催生了全新的网络文化型态,非中心主义、多元化、无终极目标的网络文化为道德相对主义提供了最好的土壤和借口。道德相对主义在很大程度上消解了网络文化中的道德
研究了辣蓼草、桑叶、何首乌3种中草药的不同比例、培曲时间、培曲温度对小曲中的微生物种类和数量、糖化力、液化力及发酵率的影响。正交试验获得最佳工艺条件为:辣蓼草∶桑
特邀嘉宾:刘老师食品质量检验专家田建强某建筑企业职工秦素中学生张大妈市民主持人:云霞出海曙,梅柳渡江春。新年的脚步越来越近了,大家都忙着准备采办年货。其中糖果是家家必
为了维护消费者的合法权益,促进食醋行业健康发展,国家质检总局组织对食醋产品质量进行了国家监督抽查。共抽查了北京、天津、河北、山西、内蒙、黑龙江、吉林、辽宁、上海、江
以回收的聚乙烯(R-PE)为基体,松木纤维(WF)为有机增强填料,轻质碳酸钙(PCC)、双飞粉(Fly ash)和二氧化硅(Si O2)为无机填料,MAPE为偶联剂采用注塑法制备复合材料,以机械性能