基于Hadoop的大规模数据排序算法研究

来源 :信息与电脑 | 被引量 : 0次 | 上传用户:lubin_1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在对Hadoop平台上的分布式文件系统HDFS和计算模型MapReduce进行深入分析和研究的基础上,提出了对单个关键字和对多个关键字的大数据排序方法,给出了排序算法的描述、Hadoop平台上的实现和性能分析。实验结果表明,Hadoop平台下的排序算法更适用于大规模数据排序。
其他文献
随着社会的进步科技的发展,我们已经逐步进入信息社会。在现代社会中,人们每天都要接触大量的信息,这些信息并不都是准确无误的。从信息本身来看,由于受统计推理的偶然性等因素影
文章以1994年1月-2012年12月的人民币实际有效汇率、国内外GDP以及进出口贸易额的月度数据为样本,通过ADF单位根检验、Johansen协整检验、LOS回归分析和Granger因果关系检验来
根据财税(2013) 106号文,自2014年1月1日起,在全国范围内开展铁路运输和邮政业“营改增”试点,从而快递行业全面纳入了“营改增”的试点范围.在快递行业里,占据快递市场近8成份
农民专业合作社是当前我国发展速度最快的市场经营主体。从组织社会学中的生命周期理论来看,农民专业合作社成长的生命周期可划分为萌芽期、探索期、成长期和成熟期。从资源
弹性预算虽然只有不到百年的短暂历史,但是却在各国的企业管理中得到了认可和接受,积累了一定的成功经验和失败教训。伴随着运用和提高的脚步,弹性预算理论的研究也深受人们关注
在当前经济体制改革日益深化,市场经济运行机制全面建设的形势下,企业要运用经济手段管理企业,向管理要效益,就需要企业的总会计师有恰当的职业角色定位,正确办理各项业务,协调各种
本文阐述了高速公路在经济建设中的重要性,探讨了高速公路是经济建设快速发展的产物,提出了高速公路网络建设的维护对策.
当记者问道关于农超对接的话题时,TESCO中国讲述了他们的直采历程。1、积极响应农超对接自TESCO进入中国市场以来,就积极响应政府号召,在农业可持续发展领域积极探索,从2007
改革开放以来,随着市场经济的蓬勃发展,各行业企业如雨后春笋般出现,并在我国经济结构中日益显示出其举足轻重的地位。企业要发展、要管理,财务管理的重要程度不可小觑。其中,预算
本文分析了造成国企数额巨大的不良债权的原因和不良债权的危害,针对集团公司上述不良债权的现状和问题提出了管理和防范措施。
期刊