论文部分内容阅读
为了处理大量分布式存储的农场环境数据,为作物增产提供异常环境参考并制定预防策略,本文结合农场环境数据的特点,在Hadoop平台中实现了对农场环境数据的Dirichlet过程混合模型聚类,并提出了基于聚类分析的农场环境异常检测方法。在Map Reduce框架下,Map阶段完成样本点到模型的分配;Reduce阶段对模型与类簇个数进行更新。通过实验验证了分布式Dirichlet聚类的性能,分析结果表明该方法可以应用于大量农场环境数据的异常检测。