MapReduce平台相关论文
提出一种基于快速无偏分层图抽样的MapReduce负载平衡方法。将聚类算法融合到MapReduce连接操作中,提出MapReduce并行聚类连接算法......
针对社交网络文档(推文)情感分类复杂且准确度低的问题,基于MapReduce平台,提出一种利用自注意力双向分层语义模型的大规模网络文......
由于知识决策、信息共享、科学研究的需求,数据拥有者(个人、企业、政府等)需要将数据对外发布。尽管数据拥有者向第三方发布数据......
Map/Reduce型海量数据处理平台(以下简称“Map/Reduce平台”)是海量数据处理领域的最新技术进展。Map/Reduce平台具有简化的并行编程......
随着互联网的普及,网页上的文本信息呈现出爆炸式增长的趋势。如何索引,检索,管理,挖掘网页上的海量文本信息已经成为计算科学领域......
由于传统倾斜数据的连接负载平衡方法设置的负载布局位置不佳,导致对负载偏移的控制效果差,因此针对MapReduce平台上的倾斜数据,提......
随着智能电网建设的不断深入和推进,积累的电力营销数据呈指数级增长,如何从这些历史数据中挖掘出"宝藏",已经成为坚强智能电网建......
压缩模糊K-近邻(CFKNN)算法仅适用于中小数据环境,且其样例选择采用静态机制,导致算法不能对阈值进行动态调整从而选出最优样例。......