论文部分内容阅读
以黑龙江省中部地区2004年的气温和降水观测数据为实例,对数据挖掘中气象数据的概化问题进行研究.调查分析了概化方法和数据特征,确定采用模糊C均值聚类算法.重点研究了算法中最佳聚类数的确定,选取多种广泛认可的指标,对聚类结果进行有效性对比分析,采用综合最优的聚类数为最佳聚类数.研究发现这种方法聚类结果合理且具有较强的可拓展性.