内存计算框架相关论文
针对Apriori算法在第二次迭代过程中产生大量候选集的弊端,在Spark大数据框架下,将Apriori算法进行并行化处理。提出一种基于Spark......
在笔者之前的工作中,提出了一种基于MapReduce和SimHash的大数据K-近邻算法(HMR-K-NN).虽然该算法能够有效解决大数据K-近邻算法的......
传统的数据分析平台Pig的执行引擎是MapReduce,由于MapReduce的局限性,使得数据处理过程中存在高延迟,内存开销大等缺点Q为克服这些不......
由于目前内存云(RAMCloud)平台的不稳定性,存在特定环境下固定数据恢复机制非最优解问题。针对该问题,提出一种适用于该架构下的探......
针对内存云(RAMCloud)平台数据恢复机制的固定性存在非智能选择数据恢复机制问题,提出一种适用于该架构下的自适应数据恢复策略.结......
近几年,由于相比于传统的磁盘计算框架运行迭代和交互式应用程序快数十倍,以Spark为代表的内存集群计算框架获得大量关注,发展迅速......