Canopy聚类技术相关论文
为了高额利润,许多公司正在大量地使用网上的廉价信息。这导致公司的数据量日趋增大。因此,从巨量的数据集中快速地找出感兴趣的模式......
在挖掘前都必须对所要挖掘的数据源进行清洗,以去掉不正确的数据。本文对数据清洗中整合多个数据源的问题做了相关的研究。针对现......
提出了一种基于聚类技术的多数据源记录匹配算法,该算法运用的罩盖(Canopy)聚类技术是一种专门对付大型数据的聚类方法,此算法不仅......