改善Hadoop文件处理效率的技术研究

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:walkman73
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种改善Hadoop文件处理效率的方法,在Hadoop中添加一个小文件处理模块SFPM,根据文件名为海量小文件建立二级索引,同时采用预加载技术将索引提前存入缓存,可提高文件查找访问效率;在合并文件时,采取舍弃多余空间的策略,避免将一个文件拆分存储在两个block上,减少了文件访问时间开销.实验结果表明该方法能有效减轻NameNode的负荷,提高小文件读写效率.
其他文献
<正>[案情简介]原告:某肉类食品有限公司。被告:矫某。原告诉称:被告2004年到我单位从事财务工作。2014年9月,因原告生产经营需要,通知被告在分公司间轮岗,被告不服从决定,于
虚拟校园是数字校园建设的基础,它的研究和创建对以后数字校园的建设有重要的现实意义。文章以山西农业大学信息学院为例,采用多场景建模方法,构建了虚拟校园的三维场景。运
2013年1月HEVC(High Efficient Video Coding)被ITU-T和ISO/IEC正式确立为新一代视频编码国际标准.为了实现更高的压缩效率,HEVC使用了多项新技术.在空间域变换方面,HEVC支持
【正】 作为科学的伦理学的形成(通过对伦理学历史材料的考察)是本书全面考察的主要问题。为了解决这个问题,作者利用了历史的东西与逻辑的东西统一的马克思主义的方法。但是
无锡,因水而生,因水成城,因水昌盛。在这片水域面积占三分之一的土地上,亘古至今演绎着一个不变的旋律——治水。公元前12世纪末,周泰伯南迁定居梅里后,带领吴人开溪凿渎,开始农田引
这个城市,从水中走来,滨江临湖,以水为脉,以河为街。这个城市,1794公里长的京杭大运河,在这里穿城而过。这个城市,因坐拥郭沫若笔下的“太湖佳绝处”而享誉天下。
新发现的两种讲课笔记证明:黑格尔作为社会哲学家在海德堡和柏林一直都是进步的在1819—1820年冬季学期黑格尔甚至谈论穷人的非常权利。
“5.12”汶川大地震给国人留下长久记忆的同时,再一次警示:经济社会的快速发展仍然难以避免突发公共事件的出现。妥善处置好突发公共事件,将增强政府的危机管理能力,进而加强执政
【正】 人都有追求享乐的心理,这种说法虽非是对人性绝对准确的描述,但它作为一种概括还是比较正确的,即:正常人不愿要痛苦,不把痛苦看作可取的价值。事实上,可以说痛苦没有
基于同杆并架双回线集中参数模型,提出了一种利用电磁耦合关系的双端测距算法。该方法是建立在集中参数模型基础上,依据相间、线间电气量耦合关系计算沿线分布电压,利用从两端计