Spark环境相关论文
Spark集群环境中的数据构成复杂、规模庞大,为此基于K-mean聚类算法设计一种并行式网络数据安全监测方法.首先设计Spark集群网络数......
本文从另一思路,根据诚信调查数据和上机以及考试数据,构建Spark环境,利用决策树分类算法,来推测学生提交的完成度数据的真实性(即......
微博、脸书等社交网络平台涌现的短文本数据流具有海量、高维稀疏、快速可变等特性,使得短文本数据流分类面临着巨大挑战。已有的......
全局同步计算模型简单易用,但是路障同步导致收敛速度变慢。以顶点为中心的异步迭代虽然提高了收敛速度,但在计算节点之间需要频繁......